文章最後更新於

數據科學家的第一步,就是了解你的工具,這篇 Knime 教學文章為您帶來兩個主題:

  1. Knime 介面教學
  2. 延伸插件安裝

溫馨提醒:如果你不知道 Knime 是什麼軟體或還沒安裝,可以到這篇文章認識 Knime、跟著文章或影片操作下載,再回到這篇文章邊學邊操作,之後的課程會更好上手喔。

Knime 目前沒有提供中文的介面和教學文件,所以物件的中文名稱是我根據功能性和易於理解給的名稱,非官方說法。

如果後續 Knime 有官方的中文翻譯,我會再做更新,目前提供中文的翻譯是希望非英語母語或不習慣使用英語的使用者也可以方便的學習和交流。

Knime 介面元素

Knime介面總覽
Knime介面總覽

Workflow Editor 工作流編輯區

Workflow Editor 是 Knime 最主要的工作空間,提供 Workflow 的視覺化呈現和設計、Node 節點的串接、Node 節點屬性的設定、放入專案描述內容,這些動作都是在Workflow Editor 工作編輯區完成。

Workflow Editor
Workflow Editor

上圖呈現一個完整 Workflow 看起來的樣貌,從最頂部黃色匡的專案描述,再往下從左到右紅藍黃綠的顏色匡分別放了不同功能的 Node 節點以及筆記標註,清楚傳達每個節點的動作和注意事項,再看到圖片中間底下的黃色便利貼 Try this,也是使用者可以自由編輯放置想傳達理念的其他做法。


KNIME Explorer KNIME 探索區

Knime Explorer
Knime Explorer

KNIME Explore 是存放工作流和數據的檔案總管區
EXAMPLES 可以連結到 Knime 線上檔案平台 (Knime Hubs),提供使用者搜尋和下載Knime 的 Workflow 範例。
LOCAL 是本機端,也就是我們自己這台電腦的檔案,EXAMPLES 下載後的檔案也會存放在 LOCAL,這樣即使在沒有網路連線的環境下,還是可以安心工作。


Workflow Coach 工作流教練

knime workflow coach
Workflow Coach

Workflow Coach 主要功能是提示使用者目前所點選節點的下一步串接 Node 建議。
舉例來說,當開啟一個新的專案時 Workflow Editor 沒有任何 Node 的時候,Workflow Coach 這時會顯示如上圖的畫面內容,左側欄位的 Recommended Nodes (推薦節點)建議你使用的節點並搭配右側欄位 Community 的預測使用機率。

因為開啟新的專案,沒有任何內容和數據,Workflow Coach 當然會首先推薦跟讀取數據有關的 Node 囉,像是 File Reader、CSV Reader,至於 Community 的機率是 Knime 根據線上提交的 Workflow 統計出來的使用機率來做推薦的,Knime 默默的也在產品中加入了大數據分析來提高使用者體驗呢!


Node Repository 節點儲藏室

Node Repository
Node Repository

Node Repository 是工作流中所用的節點列表,可以想成是放樂高積木的一個大盒子。

Knime 依不同的功能將 Node 節點分門別類,同時左側搭配小圖示幫助使用者快速識別 Node 節點的功能喔!

將左側的灰色三角形點開可以看到更下層分類,例如 Manipulatation 底下又分為對 Column 資料欄、Raw 數據列、Table 資料表的操作功能。

後面的課程會以專案的方式帶大家認識更多的 Node 節點以及怎麼使用,不想錯過後續的課程,看到文章最後別忘了訂閱 Grind Turbo 電子報喔!


Outline 鳥瞰輪廓圖

Outline
Outline

Outline 鳥瞰輪廓圖是為了讓使用者知道目前正在哪個位置,在大型、功能非常多和攏長的專案中會非常好用。

舉例來說:你可以從左上角數據讀取的 Node 節點更新好屬性後,利用鳥瞰輪廓圖的淺藍色框框,移動到右下角的報表輸出 Node 節點,也不會迷失方向感。


Console 訊息窗

Console
Console

Console 訊息窗顯示與 Workflow 執行有關的訊息和錯誤。
例如:執行圖取數據的動作,Console 就會顯示執行結果訊息,如果數據出現無法讀取的狀況,也會在 Console 中顯示錯誤訊息。


Description 描述手冊

Description
Description

Description 描述手冊像是使用說明書一樣,提供使用者 Workflow 工作流和 Node 節點的詳細資訊,圖中的 Example 為 Visual Analysis of Sales Data,可以從這個連結了解更多這個專案的內容喔!

如果你從 LOCAL > Example Workflows 點選任何一個 Workflow 工作流,你會看到 Description 對該 Workflow 的描述、Tags 標籤、發佈日期和作者名。

如果你點選任何一個 Node 節點,Description 提供節點的功能描述、輸入及輸出端的資料型態等等關於該 Node 的資訊。


Extension 延伸插件安裝

Knime 的 Workflow 範例有許多各式各樣有趣的主題專案,會運用到不同的插件,之後的教學會帶大家下載超過 100 個免費數據分析流,為了讓後續進行得更順利,我建議大家先安裝以下三個延伸插件:

安裝方法:File > Install KNIME Extensions > 勾選以下三個

  • KNIME & Extensions
  • KNIME Community Extensions – Others
  • KNIME Labs Extensions
install extension
延伸插件安裝步驟

按下 Next 並同意使用條款,Knime 下載安裝完成後會需要重新啟動才能使用新的插件喔!

Knime & Extension
Knime & Extensions 包含細項

Knime & Extensions 包含許多數據庫相關的串接功能,甚至 AWS 雲端計算的數據存儲 S3Amazon Athena、Microsoft 的 Azure Cloud Connectors 都包含在其中。

knime community extension
Knime Community Extensions 包含細項

KNIME Community Extensions – Other 包含許多外部工具的串接,例如:PythonR 的串接。


knime lab extension
Knime Labs Extensions 包含細項

Knime Labs Extensions 包含許多跟機器學習 Machine Learning 以及深度學習 Deep Learning 相關的插件,例如:TensorflowKerasH2O Machine Learning

影片

結論

今天的內容我們認識了 Knime 的介面和功能,以及安裝未來會需要使用到的延伸插件,內容比較多需要花一些時間消化,但都是為後續課程打好所需要的基礎喔!

如果學習的過程中有遇到什麼問題都歡迎留言給我,我會很樂意幫忙你!

下一次的內容我會以一個簡單的情境,帶大家一起體驗數據科學的工作流程,下次見!