ウルリッヒ・エバール氏:そうですね、たとえば、電気をより多く与える、というのではありません。学校で良い成績を取る、というのに少し似ています。ロボットは、ただポイントを集めているだけです。すなわち、コンピューターゲームをプレイするような感覚で生活しているのです。何か良いことをすると、ごほうびにポイントをもらえます。拙著「Smart Machines」のための調査をしているとき、世界のロボット工学の中心地、大阪でそのようなiCubを見かけました。そのロボットは、前にいる人が次に何をするかを正しく予測できれば、ポイントをもらえます。私は、あるときテーブルでiCubの先生の隣にすわっていて、みんなの前にはティーカップが一つだけ置いてありました。iCubは「あなたは、カップを持ち上げて飲みます」と言いました。
唯一の問題は、カップの位置が遠すぎることでした。人間はカップに手が届かないので、持つことができません。ロボットもその状況を見ています。そのときロボットは、興味深い行動を取りました。カップを人間に向かって押したのです。まるで「さあ、カップを取ってください。ポイントがほしいのです」と言うように。おもしろいのは、誰もそのような行動をするプログラムを作ってはいない、ということです。ロボットは、カップを押すことを自ら学びしました。将来、ロボットを日常生活での利用に適したものにするには、この種の報酬学習が最善の方法かもしれません。