文章最後更新於

聽到數據分析,很多人心裡會覺得好像要很會寫程式、統計很好、電腦工程出身,其實不用,我今天就要跟大家分享這個好康:Knime 數據分析軟體,完全免費,而且不需要寫程式,你一樣可以成為數據分析專家!
這篇文章會帶你認識 Knime、腦力激盪數據分析專案和最後安裝好 Knime,那就繼續看下去吧~

Knime,不難!

先聲明這不是業配文,因為 Knime 完全是一個免費的軟體,我不會從中獲利。Knime(發音近似中文:難,但跟著我一起學會發現一點都不難喔!)
會介紹 Knime 這個工具主要是遇到了以下的狀況:

  • 很多朋友問我做數據分析應該先學 R 還是 Python? 
  • 親戚問我是不是有辦法預測應該買哪隻股票會漲?
  • 經營餐飲的朋友請我幫忙做店內庫存管理和銷售預測
  • 還有各種跟數據有關的問題…..比如說數據存儲安全性(這個我恐怕幫不太上忙,這跟網路架構師比較有關喔)

我會回答我朋友,我以前用 R 後來用 Python,中途還用了 Scala,但是你可以不用學任何一種就開始玩數據、套用演算法、做預測、視覺化數據,試試看 Knime 吧,讓你不需掌握所有數據分析的技能前,先看林再見樹

我會回答我親戚還有餐飲的朋友,根據個案去設計的數據分析會更貼近需求喔,Knime 只要拖拉方塊就可以自由的設計分析流程,還有許多實務使用的分析流程可以免費下載,用 Knime 吧!

目前網路上 Knime 的中文教學幾乎找不太到,但是我覺得語言不該阻礙學習熱情,所以寫了這系列的教學文章,希望對大家有幫助。

Knime 的特色功能

Knime 除了提供數據科學工作四大階段的工具外,還有其他很優秀的地方跟大家分享:

Knime其中一個回歸分析範例
Knime其中一個回歸分析範例

圖形化介面

看到上方的 Knime 數據分析流畫面,只需要拖拉不同顏色與功能的小方塊,Knime 稱它為 Node 節點,組合在一起就可以完成數據分析流程,可以說是大人版的樂高了。每個小方塊處理一件事有一個很大的優點,就是當遇到問題的時候可以很輕易的找到出問題的節點,不用在程式碼推裡面找 bug。

由度極高的註記功能

Node 可以隨意移動和放置,結點可以自由命名外,連接節點的連接線也可以自由放上標注,例如標注數據訓練集和測試集。
色塊註記功能能夠讓使用者寫上專案內容、各分析階段的注意事項等等的資訊。

產業應用分析流程免費下載

Knime Hub 是一個強大的資料庫,上面有超過 100 個正在使用的產業解決方案分析流程,都是可以免費下載來學習和應用的。

工具整合度高

Knime支援的演算法
Knime支援的演算法
  • 眾多演算法
    右圖可以看到 Knime 提供了很多常用的演算法,分類、分群、回歸、PCA、SVM等等,應有盡有,使用起來綽綽有餘囉。
  • 整合 R / Python / Jupyter / Tensorflow 等工具
    前面說到使用 Knime 的一大福音是只要拖拉方塊就可以做數據分析,但 Knime 的功能不斷完善,現在還整合了Python / R 和 Jupyter 呢,也就是說你做完的專案輸出成 Jupyter 後,寫 Code 的數據科學家也可以運用你做的東西,說不定他還沒發現你不會寫程式呢!另外,深度學習 (Deep Learning) 的工具也不會少喔,例如 Tensorflow / PyTorch,但我們等後續進階再來討論吧。
  • 整合外部工具 AWS / Azure 雲端平台
    漸漸越來越多的企業將數據搬移到雲端,Knime 在這方便也提供了串接的工具,讓使用者工作上更迎刃有餘,例如 AWS 的 S3、RedShift 等資料存儲空間,都不阻擋你了你用 Knime 喔。

視覺化套件豐富

數據科學家不論是數據理解或是呈現結果給其他人看時,是覺化的過程是少不了的,基本的散佈圖 Scatter Plot、雷達圖 Radar Chart、直方圖 Histagram、地圖依定不會少的。

Knime支援多種視覺化
Knime支援多種視覺化

Knime 適合什麼人用?

任何想自己動手做數據分析的人都可以使用喔,你可以是:

  • 還在國高中生或是大學生,非相關科系也可以輕鬆學會
  • 市場行銷人員或是產品銷售經理分析銷售數據
  • 你也可以是創業的早餐店老闆分析顧客飲食規律
  • ……

只要準備一台可以連線上網的電腦,你就擁有了整箱樂高。

我可以用 Knime 做什麼分析專案?

目前沒有想法沒有關係,你可以試著從你的職業出發,想一個想解決的問題,唯一要注意的地方就是要有相關的數據,如果沒有數據也不要在意,後續我會教大家去哪裡下載數據,提案的話可以參考以下的舉例:

提案#1. 早餐店老闆分析顧客飲食規律

就像 Walmart 的購物籃分析,或稱關聯規則分析,早餐店老闆也可以根據顧客點餐的組合來分析,知道顧客的消費習性,例如:點番茄義大利麵的客人,有 80% 的機率都點了大杯冰奶茶,不論是在推出套餐方案或是做行銷的時候,你都可以知道哪些是你的目標族群,對哪些人推薦會有效果;未來甚至還可以做定價分析和庫存管理呢。

提案#2. 首購族買房價格評估或租屋族房租合理價格分析

數據分析平台 Kaggle 上一個經典的分析案例就是房價預測,根據數據中房子的坪數、屋齡、房間數、有無車庫、購入價格等數據欄位,預測物件的價格。同樣的方法,我們也可以用來分析台灣買屋和租屋金額預測,這方面的數據網路上都可以找得到喔。

提案#3. 財務金融相關分析

數據分析領域有很多人都是這個領域去發展的,除了大到有企業級的數據分析,像是信用卡盜刷預測、消費軌跡外;小到也有個人的財務狀況分析、選股分析等可以去找想法喔。

Knime下載與安裝

想必你一定迫不及待想開始一個數據分析專案了吧,跟著底下影片安裝或下面幾個步驟安裝,你就可以準備好工具開始做數據分析專案囉。

安裝步驟

Step.1 前往 Knime 官網
Step.2 點擊右上角黃色 Download
Step.3 填寫基本資料、同意隱私權政策及使用規範(如果你不希望收到入門教學或更新通知的 Email,可省略這個步驟)
Step.4 選擇符合作業系統與規格的選項下載檔案( Windows 使用者不確定 64 / 32 位元數可以照著連結上的步驟查詢。)

下載並且安裝完成後,開啟 Knime 數據分析軟體,會跳出一個對話筐,詢問你檔案存儲的路徑,可以保持預設的路徑或選擇你想要放置檔案的路徑,之後按下 Launch。

等待Knime初始化安裝套件後,您就看到以下的工作畫面表示你成功安裝好 Knime 囉!

Knime使用介面
Knime 使用介面

總結

恭喜你完成下載一個強大又好用的數據分析工具 Knime,下次的教學就正式進入 Knime的世界囉!
目前的課程後續安排為:
1. Knime 介面教學和安裝延伸插件
2. 經典案例體驗數據科學家工作流程 (數據科學家養成班試看單元)
3. 下載超過 100 個免費分析流程範例 (數據科學家養成班試看單元)

如果有任何問題或想法,歡迎留言給我
教學文章會陸續發佈喔,如果不想錯過 Knime系列教學,那就立馬訂閱電子報吧!