Microsoft の機械学習・深層学習の研究開発、OSSライブラリ、クラウド製品についてまとめています。随時アップデートしていきます。最新版は konabuta/ML-tech をご参照ください。
ML-tech
Microsoft libraries, tools, recipes, ample codes and workshop contents for machine learning & deep learning.
1. Library & tool
LightGBM
高速勾配ブースティングのライブラリ。Kaggle の成績上位者が良く利用しており、現場でも実績がある。
EconML
統計的因果推論の推定ライブラリ。Microsoft Research の Alice Project.
DoWhy
統計的因果推論のライフサイクルをサポートするライブラリ(フレームワーク)。
Nueral Network Intelligence
Neural Architect Search, Hyperparameter Tuning などの AutoML Toolkit。
InterpretML
一般化加法モデルのGA2Mを実装したライブラリ。一般化線形モデルよりも柔軟な設計が可能なため精度向上が期待できる。モデルが解釈可能なことでも注目されている。
Interpret Community
様々なモデル解釈のテクノロジーを統合 API 経由で提供。また、専用の Dashboard によりモデルの解釈が可能に。
MMLSpark
分散コンピューティング環境 Apache Spark 上で動作する機械学習フレームワーク。LightGBM、OpenCV なども利用可能。
EdgeML
Edge デバイスのための機械学習のアルゴリズム。
Dice
反事実 (counterfactual) によるモデルの解釈
MMdnn
Deep Neural Network を可視化するクロスフレームワークソリューション
TensorWatch
機械学習のデバック、可視化ツール
ONNX Runtime
ONNX モデルファイルを動作させるランタイム
TagAnomaly
時系列データ用のタギングツール
VoTT
画像、動画データ用のタギングツール
TextWorld
テキストベースの強化学習のためのゲームシミュレーター
AirSim
自動運転シミュレーター
UniLM
UniLM - Unified Language Model Pre-training
Vowpal Wabbit
Microsoft Reserch と旧 Yahoo! Research が開発している高速機械学習ライブラリ。オンライン機械学習、強化学習にも対応。
Microsoft Z3 Solver
定理証明器 (Theorem Prover)
COCO Dataset
画像データ。80個のカテゴリ、20万以上のラベル付き画像データ、150万個のオブジェクトインスタンスを提供。Microsoft, Facebook などが主要スポンサー。
2. Recipe
Computer Vision
コンピュータービジョンのベストプラクティス集
Neural Language Processing
自然言語処理のベストプラクティス集
Recommenders
推薦システムのベストプラクティス集
MLOps
MLOps のベストプラクティス集
3. Sample Codes
Azure Machine Learning 関連
Azure ML Sample Codes
Azure Machine Learning 公式サンプルコード。
BERT
BERT の E2E の再学習・転移学習のサンプルコード
Distributed Deep Learning
分散 Deep Learning サンプルコード。
Hyperdrive for Deep Learning
Deep Learning モデルのハイパーパラメータチューニングのサンプルコード。Mask RCNN を利用。
Batch Inference
バッチ推論のサンプルコード。
ML on IoT Edge
Azure IoT Edge に機械学習モデルをデプロイする手順サンプル
4. Workshop
Causal Inference and Counterfactual Reasoning @KDD2018
因果推論と基本的な理論の解説 & 因果推論フレームワーク DoWhy ライブラリのチュートリアル
Nvidia Rapids on Azure ML
Azure Machine Learning 上で NVidia Rapids を利用するためのチュートリアル。詳細ブログはこちら。
Deep Learning for Time Series Forecasting @KDD2019
深層学習による時系列予測モデリングのチュートリアル。
From Graph to Knowledge Graph @KDD2019
グラフデータとそのモデリングの基礎チュートリアル。
AutoML Workshop @Dllab
Azure の AutoML に関するチュートリアル。
Deep Learning with TensorFlow 2.0 and Azure @TensorFlow World 2019
BERT を用いて Stack overflow の質問に自動的にタグを付与するモデル開発を行うワークショップ
5. Training
Foundations of Data Science
データサイエンスの基本的な理論について記載している PDF
Python for Beginners
初心者向け Python 無料講座
Top comments (0)