跳到主要內容 跳至補充內容

建立並設定實驗

第一步是建立並設定實驗。您將會使用先前上傳的訓練資料集來訓練模型,直到準備好部署以進行預測為止。

建立新的實驗

  1. 前往 分析 活動中心的「建立」頁面,並選取 ML 實驗

  2. 輸入實驗名稱,例如客戶流失教學課程

  3. 也可以選擇新增說明和標記。

  4. 選擇用於實驗的空間。這可以是個人空間或共用空間。

  5. 按一下建立

  6. 選取訓練資料集檔案。根據您使用 CSV 或 QVD,這將會是下列任一項內容:

    • ML - Churn data - training.qvd

    • ML - Churn data - apply.qvd

檢閱資料

現在您已準備好開始設定實驗,但在開始之前,我們來看看資料集。

我們在資料索引標籤開始。預設檢視是 表格列 結構描述檢視在此我們可以看見每列呈現資料集某欄的表格。已在自動資料準備時產生統計資料和深入資訊。您可能必須捲動至結構描述右側以查看深入資訊

我們可以看見 AccountID 由於高基數而被排除。這表示欄包含太多唯一值。特徵 Country 則是由於相反原因而被排除:該值在所有列都相同。 這兩個特徵不會對機器學習模型提供任何值。

我們也可以看見類別特徵 Territory 已經過 impact encoded。將游標暫留在 警告三角形警告三角形 圖示上,以獲得更多資訊。

用於在 Qlik Predict 中訓練資料集的結構描述檢視

ML 實驗中的結構描述檢視具有關於特徵的深入資訊。

按一下 資料檢視 資料檢視。在此檢視中,我們可以看見更多關於每欄的資訊,包括樣本資料。

資料檢視

實驗設定中的資料檢視。

選取目標

我們希望機器學習模型預測客戶流失情況,因此選取資料集的最後一欄 Churned (已流失) 作為目標。

  1. 切換回 表格列 結構描述檢視

  2. 將游標暫留在 Churned 上方,並按一下顯示的目標 目標 圖示。

會選取結構描述檢視中的列作為目標

所選目標的表格列。

在實驗設定面板上,我們現在可以看見已選取 Churned。我們也可以看見自動選取和排除了哪些特徵。Churned 是目標,所以不會作為特徵使用。我們也可以看見此實驗將會作為二元分類問題來處理。

資訊顯示在實驗設定面板

實驗設定面板與所選目標和預設特徵選項

特徵選取和模型最佳化

依照預設,實驗會設定為使用智慧模型最佳化。若要確認,在實驗設定面板,展開模型最佳化。應選取智慧選項。

實驗設定面板中確認智慧模型最佳化

開啟了智慧模型最佳化的實驗設定面板

可以在設定面板的特徵區段手動設定特徵選項。透過智慧模型最佳化,可以移除無用的特徵,以自動處理特徵選項。啟用此設定後,我們可以在訓練中包含所有可用的特徵。

訓練實驗

設定完成後,我們就準備好開始訓練。

  • 在實驗視窗的右下角,按一下執行實驗

實驗完成執行後,我們可以繼續進行下一步,即檢閱產生的模型指標。

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!

OSZAR »