建立並設定實驗
第一步是建立並設定實驗。您將會使用先前上傳的訓練資料集來訓練模型,直到準備好部署以進行預測為止。
建立新的實驗
請執行下列動作:
-
前往 分析 活動中心的「建立」頁面,並選取 ML 實驗。
-
輸入實驗名稱,例如客戶流失教學課程。
-
也可以選擇新增說明和標記。
-
選擇用於實驗的空間。這可以是個人空間或共用空間。
-
按一下建立。
-
選取訓練資料集檔案。根據您使用 CSV 或 QVD,這將會是下列任一項內容:
-
ML - Churn data - training.qvd
-
ML - Churn data - apply.qvd
-
檢閱資料
現在您已準備好開始設定實驗,但在開始之前,我們來看看資料集。
我們在資料索引標籤開始。預設檢視是 結構描述檢視在此我們可以看見每列呈現資料集某欄的表格。已在自動資料準備時產生統計資料和深入資訊。您可能必須捲動至結構描述右側以查看深入資訊。
我們可以看見 AccountID 由於高基數而被排除。這表示欄包含太多唯一值。特徵 Country 則是由於相反原因而被排除:該值在所有列都相同。 這兩個特徵不會對機器學習模型提供任何值。
我們也可以看見類別特徵 Territory 已經過 impact encoded。將游標暫留在 和
圖示上,以獲得更多資訊。
用於在 Qlik Predict 中訓練資料集的結構描述檢視

按一下 資料檢視。在此檢視中,我們可以看見更多關於每欄的資訊,包括樣本資料。
資料檢視

選取目標
我們希望機器學習模型預測客戶流失情況,因此選取資料集的最後一欄 Churned (已流失) 作為目標。
請執行下列動作:
-
切換回
結構描述檢視。
-
將游標暫留在 Churned 上方,並按一下顯示的目標
圖示。
會選取結構描述檢視中的列作為目標

在實驗設定面板上,我們現在可以看見已選取 Churned。我們也可以看見自動選取和排除了哪些特徵。Churned 是目標,所以不會作為特徵使用。我們也可以看見此實驗將會作為二元分類問題來處理。
資訊顯示在實驗設定面板

特徵選取和模型最佳化
依照預設,實驗會設定為使用智慧模型最佳化。若要確認,在實驗設定面板,展開模型最佳化。應選取智慧選項。
在實驗設定面板中確認智慧模型最佳化

可以在設定面板的特徵區段手動設定特徵選項。透過智慧模型最佳化,可以移除無用的特徵,以自動處理特徵選項。啟用此設定後,我們可以在訓練中包含所有可用的特徵。
訓練實驗
設定完成後,我們就準備好開始訓練。
請執行下列動作:
-
在實驗視窗的右下角,按一下執行實驗。
實驗完成執行後,我們可以繼續進行下一步,即檢閱產生的模型指標。