PlaidML

前陣子 Apple 發表了新筆電,卻僅止搭配 AMD GPU, 讓我滿心期待可以使用 NVIDIA 訓練 Tensorflow 模型的期望落空。(森氣😤)

在閱讀了這篇文章後,下載了 PlaidML 來試用,它有試驗級功能:支援 Mac + OpenCL GPU(Intel/AMD) 或是原生的 Metal API, 來訓練神經網路,好開心啊!

PlaidML 是一套開源機器學習加速庫,希望讓使用者透過 Keras APIs 直接使用(任何一家的)GPU 來運算,也就是支援 Intel/NVIDIA/AMD/Apple Metal. 看到這裡,不禁讓我有些心動,於是下載來試用。
http://vertex.ai/blog/announcing-plaidml

Continue reading

機器學習 – 馬力歐/MarI/O

https://www.youtube.com/watch?v=qv6UVOQ0F44
MarI/O - Machine Learning for Video Games

這部影片解釋了我們利用神經網路來玩馬力歐遊戲:

• 綠色線:表示連結為正值,遇到黑/白方格,繼續輸出同一顏色。
• 紅色線:表示連結為負值,遇到黑/白方格,輸出反相/改變動作。
• A/B/X/Y...Left/Right 對應搖桿上的按鈕,也表示賦予馬力歐的「動作」。
• 輸入為瑪莉歐的位置。
•中間連結單一結點神經元。
  1. 起始神經網路,隨機挑選一動作+線條: 白方格+綠線+Right
  2. 這表示一直讓馬力歐向右前進,直到其中一條神經網路的紅線+動作(譬如:A鍵)遇到方格,改變成為馬力歐的下一個動作(A鍵)。
  3. 反覆 1, 2 步驟,目標是極大化分數。

詳細步驟請參看影片說明。

• 啟發本文源自:https://www.analyticsvidhya.com/learning-path-learn-machine-learning/

讀後摘要 DpLRN with TF 2/E – part 1

Supervised LRN

  • 使用 labeled/pre-defined training data
  • 缺點:problem of generalization
  • 典型 workflow:
    1. 切分資料為:training, development/validation, test sets
    2. 使用 training set 訓練模型
    3. 訓練時,使用 validation set 驗證 training set, 減輕 overfitting. 以及 regularization 模型
    4. 使用(模型未曾見過的) test set 評估模型效能
    5. Tuning model based on hyper-parameter optimization
    6. Deploy best model into a production-ready environment
  • 有「分類」以及「迴歸」兩種:依照輸出是否為連續值來判斷。
  • 分類問題中,要注意「Unbalanced (input) data」:
    * Little unbalanced: 60% for one class, 40% for the other class
    >> 此時需要將 data 隨機分為三份:50% training, 20% validation, 30% testing

    Pasted Graphic 2

Continue reading

課後心得 – Machine Learning with TensorFlow on Google Cloud Platform Specialization

Google 大概是目前檯面上將機器學習應用落地[1][2]最多的一家公司,近日他們在 Coursera 上推出新的機器學習專業課程(五門),課程內容著重於收集/整理資料、如何提取特徵,優化模型的策略並示範如何利用 Google Cloud Platform (GCP), Tensorflow 建立機器學習/神經網路模型,導入生產流程。

編按:據聞將有第二系列進階課 – Advanced Machine Learning on GCP 喔!(期待 😀)

07_ML_in_Google_Products

概覽

以下圖 Call Center Feedback 為例,我們學了機器學習、深度神經網路後,在真實情境中:

  • 如何定義機器學習問題?
  • 如何提取(重要/有效)特徵?
  • 如何建立/訓練/調教模型?
  • 如何使用模型來預測/辨識/推薦/規劃/做決策?

MLbp

在巨量資料的時代,應用機器學習除了考慮前述問題之外,亦需考慮如何讓演算法/模型具備可拓展、高穩定性,因此 Google 認為發展一套可以模組化處理/分析資料的流程,刻不容緩,在實務上將會深深地影響使用機器學習演算法效率與性能。

de

Continue reading

筆記整理 – 統計學(一) Statistics I

推薦兩們線上課程:
交大開放式學院 – 唐麗英 – 基礎統計學、統計學(二)

課程講解邏輯脈絡清晰、組織有條,容易幫我們建構一張統計學的學習藍圖。👍

(未完,不定期更新內容)

Continue reading