ねむり時間計レビュー 機器編 #オムロンヘルスケアオフィシャルレポーターねむり時間計レビュー スマホアプリ編 #オムロンヘルスケアオフィシャルレポーター

2016年06月23日

TensorFlow勉強会(4)

6/22、TensorFlow勉強の4回目に参加してきました。会場はグーグル東京オフィスです。



Googleの機械学習プロダクトのアップデート

発表者:Google Inc クラウドデベロッパーアドボケイト 佐藤一憲
概要:Googleの機械学習プロダクトの最新情報を提供します。

Update: SyntaxNet May 2016

  • 来週新しいサービスが!

  • Tensor Processing Unit

    8bitのCPUは誤解

    データセンターコストの1/3が電力なので

    実際使ってるよ

    • RankBrain
    • AlphaGo
    • GooglePhoto
    • Speech
  • Tensorflow Wide&Deepが来週発表: Linear Models + Neutral Networks

TensorFlowで趣味の画像収集サーバーを作る6月号

発表者:有限会社シーリス 代表 有山 圭二
概要:Googleの技術を支える「TensorFlow」を使って、個人で趣味の画像収集サーバーの構築にトライしています。取り組む中でのつまづきや発見など、進捗を報告します。

好みの眼鏡っ娘画像を自動で集めたいw

2クラス分類かな?眼鏡有無

Tensorflow本執筆中→眼鏡っ娘画像の権利関係どうしよう→CIFAR-10 BASEで→一からやってみる四苦八苦の一部をネタに→初稿、レビュアーの指摘をもとに直す→バッチサイズ1から64、GPU利用率UP、GPU頑張って無かったorz

TensorFlow唐揚サーバーロボット

発表者:株式会社アールティ 代表取締役 中川友紀子
概要:TensorFlowで構築したニューラルネットワークを用い、唐揚をロボットアームで仕分けます。

人工知能

  • 身体知
  • 形式知

ロボットで食品を扱う

  • ロボットは加工まで、

    • 柔らかいものを掴むのは難しい
    • 力の制御、重力補償で動作
    • webエンジニアにも使ってほしい→JSONコードで動く
  • データ用に唐揚げ作るのも大変

  • 唐揚げとグーの差がわからない、境界がわからない等々
  • ROS(Robot Operating System)
  • Demo

なお、唐揚げはスタッフが美味しくいただきましたw

Q&A

  • 不正解データは?→人にとって不正解はみんな入れてみた
  • 食品を掴む→最後のフロンティア→お弁当を詰めるおばちゃんを集めるのも大変になってきている→ロボット化
  • 滑る対策は?→ゴム手

TensorFlowで逆強化学習

発表者:株式会社ブレインパッド 太田 満久
概要:未定

逆強化学習とは

良い→場面によって色々→定量的に評価したい→「良い」に導ける」

目的

  • 自動運転等々

ゴールが明確に出来ない時の「良さ」を定義

逆強化学習では最適な行動から報酬を導ける

行動予測→行動軌跡から「人の好む経路」を学習。属性の価値推定で別シーンへの適用を可能に

安全運転→生活道路の危険予測をモデル化

論文紹介…

やってみた

逆強化学習によってゴールに非常に高い報酬

TensorFlowでDQN(Deep Q-Network)

発表者:ITエンジニアのための機械学習理論入門 著者 中井悦司
概要:ビデオゲームの自動プレイで有名になり、AlphaGoでも利用されているDQNの理論的な仕組みと、TensorFlowによる簡単な実装例を紹介します。GoogleCloudDatalabでライブデモにも挑戦します。

qiitaの倒立振子見ててtensorflowでやってみた

今日はDQNとはに絞りますw

適用例→ビデオゲーム、画面気イメージからルールを知らずに点数を取る→どうやって?→取得点数が高くなる操作方法を学習

点数と次の状態を山ほどかき集めた→なんかして次の瞬間得られる報酬をチェック→これではうまくいかない

ゴールはトータルの点数を高くする事。

トータルの点数がわかる魔法関数Qを仮定。Qをどう作るかがチャレンジ

Qはわからんけどパラメータを調整すればQになればいい

1番難しいのはデータを集める所→どうする?→ランダムにキー入力?→非現実→ある程度ランダムにやった後Q関数使う、そしてまたランダム&Q関数の繰り返し→正しいベストと思われるデータだけではダメでわざと失敗するデータも必要

AlphaGoはその時点の点数がわからない→value networkプロの学習→これで評価、policy networkで対戦、Q関数をリアルタイムで構築し対戦。

TensorFlowとGymでDoubleDQN

発表者:シーエイトラボ株式会社 代表
シンギュラリティ株式会社 CTO 新村拓也

強化学習→なんかの行動に対する報酬で1番いいものは何か探索

ひたすらシミュレーションして以下の詳報をひたすら集める

過大評価を避けるために…

数式を書くのが大変だったので写真メイン。後で可能ならを文字起こししたいな

最後に

今回の気づきとしては、Tensorflowはもっとゆるく使っていいんだなって事を学習できたって事ですね。PCがあれば使えるんだから課題に対して使えそうならやってみて、それから考えても良さそう。



このエントリーをはてなブックマークに追加 Share on Tumblr Clip to Evernote
highfrontier at 12:00│Comments(0)study 

コメントする

このブログにコメントするにはログインが必要です。

ねむり時間計レビュー 機器編 #オムロンヘルスケアオフィシャルレポーターねむり時間計レビュー スマホアプリ編 #オムロンヘルスケアオフィシャルレポーター