讀後摘要 DpLRN with TF 2/E – part 1

Supervised LRN

  • 使用 labeled/pre-defined training data
  • 缺點:problem of generalization
  • 典型 workflow:
    1. 切分資料為:training, development/validation, test sets
    2. 使用 training set 訓練模型
    3. 訓練時,使用 validation set 驗證 training set, 減輕 overfitting. 以及 regularization 模型
    4. 使用(模型未曾見過的) test set 評估模型效能
    5. Tuning model based on hyper-parameter optimization
    6. Deploy best model into a production-ready environment
  • 有「分類」以及「迴歸」兩種:依照輸出是否為連續值來判斷。
  • 分類問題中,要注意「Unbalanced (input) data」:
    * Little unbalanced: 60% for one class, 40% for the other class
    >> 此時需要將 data 隨機分為三份:50% training, 20% validation, 30% testing

    Pasted Graphic 2

Continue reading

課後心得 – Machine Learning with TensorFlow on Google Cloud Platform Specialization

Google 大概是目前檯面上將機器學習應用落地[1][2]最多的一家公司,近日他們在 Coursera 上推出新的機器學習專業課程(五門),課程內容著重於收集/整理資料、如何提取特徵,優化模型的策略並示範如何利用 Google Cloud Platform (GCP), Tensorflow 建立機器學習/神經網路模型,導入生產流程。

編按:據聞將有第二系列進階課 – Advanced Machine Learning on GCP 喔!(期待 😀)

07_ML_in_Google_Products

概覽

以下圖 Call Center Feedback 為例,我們學了機器學習、深度神經網路後,在真實情境中:

  • 如何定義機器學習問題?
  • 如何提取(重要/有效)特徵?
  • 如何建立/訓練/調教模型?
  • 如何使用模型來預測/辨識/推薦/規劃/做決策?

MLbp

在巨量資料的時代,應用機器學習除了考慮前述問題之外,亦需考慮如何讓演算法/模型具備可拓展、高穩定性,因此 Google 認為發展一套可以模組化處理/分析資料的流程,刻不容緩,在實務上將會深深地影響使用機器學習演算法效率與性能。

de

Continue reading

Kaggle 初體驗

近日開始練習 Kaggle 上的一些題目,意外發現官方的初學者教學,意外寫得好!(大開心😀)
教學主要分成 Machine Learning, R 語言, Data Visualization, Deep Learning 四個部分。

不推薦的話,良心會不安~ XD

kaggleBannder
注:本圖擷取自 www.kaggle.com/learn 網站

初探 GoNum

  • 下載安裝:
    go get -u gonum.org/v1/gonum/...
    go get github.com/kniren/gota/dataframe
    // 解決套件相依問題
    cd github.com/kniren/gota/dataframe
    go get -t -u ./...
  • 輕量、僅針對 slice of floats 操作, 用
    "gonum.org/v1/gonum/floats"
    
  • 若是針對大範圍 matrices 和 vectors 操作, 則用
    "gonum.org/v1/gonum/mat"
    "gonum.org/v1/gonum/blas/blas64"
    

Continue reading

Data Science in Go

這篇就用來記錄在 Data Science 領域使用 Go 語言開發、應用的資訊。

Latest News

作者 議題
Running a Keras / TensorFlow Model in Golang
Putting Eyes on the IoT: Advanced Computer Vision Using Golang – 軟體工程師 Ron Evans 示範使用 GoCV – Golang OpenCV 3 library.
教學文 Linear Regression With Go

Learning Resources

Pic Description
Machine Learning with Go — 2017/10 月 Packt 出版,是第一本探討 Go 實作機器學習的書/教學影片。
Go Machine Learning Projects By Xyanyi Chew, December 2018 — Exciting breakthrough projects to explore capabilities of GO and Machine Learning.

Continue reading

Deep Learning Resources

機器學習 –
人工智慧(Artificial Intelligence)分支,透過演算法以及大量資料訓練出神經網路模型,並利用此模型進行預測。常見機器學習有三大類:

* 監督式學習/Supervised Learning
* 非監督式學習/Unsupervised Learning
* 增強式學習/Reinforcing Learning

應用範圍相當廣泛,諸如:
推薦引擎、定向廣告、需求預測、垃圾郵件過濾、醫學診斷、自然語音處理、搜尋引擎、詐騙偵測、證券分析、視覺辨識、語音識別、手寫辨識等。

深度學習 –
是機器學習的分支,目前成長最快的領域,常見架構有:
多層感知器(Multilayer Perceptron)、深度神經網路(Deep Neural Network)、卷積神經網路(Convolutional Neural Network, CNN)、遞迴神經網路(Recurrent Neural Network, RNN)等。

應用於:視覺辨識、語音識別、自然語言處理、生物醫學等領域。

Learning resources:

Continue reading