11 Oct '17, 10pm

産総研がタオルたたむロボット、「強化学習より短時間で学習」 - 日経テクノロジーオンライン

 動作の学習きは、2種類のニューラルネットを用いる(図2)。1つは画像から特徴量を検出するためのオートエンコーダ(DCAE:Deep Convolutional Auto-Encoder)で、64×64画素のRGB画像を10次元程度の特徴量に変換。これを、MTRNN(Multiple Timescales Recurrent Neural Network)と呼ぶRNNの一種に入力すると、次の時間ステップに実行すべき動作を出力する。ロボットの動作は、関節の角度やグリッパの動きなどの合計14のパラメータで記述する。学習時には人による遠隔操作の指示も入力し、出力が人の操作に近づくように学習させる。

Full article: http://techon.nikkeibp.co.jp/atcl/event/15/091100139/1011...

Tweets