Search

キーワード検索

広大な荒野を走る二頭の馬_メインビジュアル_sp

2026.01.29

パートナーとして共存するAIやロボットの実現を目指す(前編)

2024年9月に行われた第42回日本ロボット学会学術講演会では「優秀研究・技術賞」IEEE SMC2024では「Best Paper Award」。さらに、2025年5月に開催されたロボカップジャパンオープン@ホームリーグでは、日本ロボット学会から「日本ロボット学会賞」を立て続けに受賞するなど、活躍が目覚ましい若手ロボティクス研究者がいる。創価大学理工学部准教授の萩原 良信氏だ。さまざまな研究課題に取り組むだけでなく、人工知能技術の社会実装に向けて多様な競技会に携わっていその幅広い活動の先に、何を目指しているのか。弊社代表の山本が話を聞いた。前編では、専門分野や共著書『ROS2とPythonで作って学ぶAIロボット入門 改訂第2版』執筆の想いなどを語ってもらった。 

創価大学 理工学部 情報システム工学科 准教授 

萩原 良信氏 

PROFILE

2010年 創価大学大学院工学研究科情報システム学専攻 博士課程修了博士(工学)。その後、創価大学工学部 助教国立情報学研究所 特任研究員立命館大学情報理工学部 助教・講師、同学総合科学技術研究機構 研究准教授を経て、2024年 創価大学 理工学部  准教授に就任。現在、立命館大学総合科学技術研究機構 客員研究員玉川大学脳科学研究所 特別研究員兼務する。共著書にROS2とPythonで作って学ぶAIロボット入門 改訂第2版 (KS理工学専門書)』などがある。 

 

 

【こんな方に、ぜひ読んでいただきたい】 

 

〇未来の働き方・人材育成の変化を戦略的に捉えたい経営層 
〇DX/新規事業でテクノロジーの価値づくりを考える管理職 
〇AI・デジタル変革を「抽象論」で終わらせたくないビジネスパーソン・理系学生 

 

【前編のエッセンス】 

 

萩原先生は、知能ロボティクスと知能情報学を専門とし、人とロボットが相互作用しながら学習・発達する「記号創発ロボティクス」と、家庭で役立つ生活支援ロボットの研究を両輪として進めている。ロボカップ@ホームを実践フィールドに、人間の認知や発達過程を手がかりに、言語理解と物理的行動を統合する知能の実現を目指す。近年はLLMの登場により、従来困難だったプランニングが大きく進展しつつあり、ロボット自身が不確実な環境知識を獲得・活用する枠組みの構築に取り組んでいる。 

 

 

【前編のキーメッセージ】 

 

キーメッセージ① 

生活支援ロボット実現の鍵は、人の認知や発達を模した記号創発ロボティクスにあり、基礎理論と実環境での応用を往復する研究が重要である。 

 

キーメッセージ② 

言語理解と物理的作業を統合する知能は未解決課題であり、人とロボットが協調して生活を支える社会の実現が研究の目標である。 

 

キーメッセージ 

LLMの活用によりロボットのプランニングは大きく進化し、不確実な環境知識を自律的に獲得・活用する知能が現実味を帯びてきた。 

01

専門分野は知能ロボティクスと知能情報学

虫眼鏡越しに覗いた夕暮れの高速道路

―最初に、萩原先生の研究テーマから教えていただけますか。 

 

私の専門分野は、知能ロボティクスと知能情報学です。知能ロボティクス(センサーやAI、駆動技術を組み合わせたロボットの設計・製造・制御に関する技術全般)は、人工知能とロボティクスの融合領域の研究分野です。特に私が中心として取り組んでいるフィールドが大きく2つあります。 

 

一つは、人とロボットが共に学習していくための「記号創発システム」(ロボットが人間のように環境と相互作用しながら、新たな意味や記号を創出していく研究分野)の基盤技術の開発です。このアプローチは、京都大学大学院の谷口忠大先生(情報学研究科 情報学専攻認知システム講座 教授)を中心に進められてきたもので、私が立命館大学に勤めていた2015年から2024年まで、創発システム研究室にて一緒に研究をさせて頂きました。 

 

もう一つが、生活支援ロボットの学習、認知、予測に関する計算モデルの開発です。ロボカップ日本委員会が主催するロボカップ@ホームや日本ロボット学会のインテリジェントホームロボティクス研究専門委員会をフィールドとしており、現在も委員や幹事を務めています。ここでは、家事や介護など、家庭環境で役に立つ生活支援ロボットの実現を目指しています。これら二つのフィールドを軸に、研究を進めています。 

 

―それらの研究に着手された経緯を教えてください。 

 

もともと、博士後期課程の頃から、画像処理を用いた生活支援ロボットのナビゲーションの研究に取り組んでいました。その流れの中で、ロボカップ@ホーム(自律移動型ロボットによる競技会で、キッチンやリビングなど日常生活の場で人間との共同作業を追求する分野)に出会い、2011年から参加するようになります。人との言語的なコミュニケーションを介して、役に立つ作業を行うロボットの研究に取り組む中で、人間なら自然にできることをロボットにやらせようとすると、「こんなにも難しいのか」と感じる場面が数多くありました。当初は、赤外線距離センサーなどの人間とは異なる計測技術で何とか実現しようとしたのですが、なかなか上手くいきません。その過程で、さまざまな研究分野や論文に触れるようになり、特に強く惹かれたのが谷口先生の推進されている記号創発ロボティクスでした。 

 

この研究は、構成論的アプローチ(対象を理解するためにコンピュータやモデルを用いて構築し、それを動かすことで理解を得る方法論)に基づいています。私は、人工知能研究とは、人の知能の本質を捉え、その仕組みを理解しようとする営みだと考えています。人間が行っている認知や思考を手掛かりにモデルを構築し、それを動かしてみることで理解を進めていく。その具体的な実践の一つが、記号創発ロボティクスだと捉えています。 

 

この背景には、認知発達ロボティクスという考え方があります(人間の認知発達メカニズムを参考にしながら、ロボットが自律的に学習し、認知能力を高めていく学際的な研究分野です)。現在のChatGPTのようなモデルは、ある意味では「大人の知能」に近い振る舞いを示しています。一方で、3歳児や5歳児のように、限られた少ない経験から言語を獲得し、他者とコミュニケーションしていくといった発達過程は、まだ十分に実現できているとは言えません。もし仮に、5歳児程度までの発達する知能が人工的に実現できれば、実はその先の知能は、人間と同じ教育環境に置くことで獲得されていくのではないか、という仮説を立てる事ができます。 

 

そのため、言語や概念を獲得していく初期の発達する知能こそが、今後の人工知能分野における重要な研究課題になると考えています。 

 

この認知発達ロボティクスの考え方は、日本では浅田稔先生(大阪大学名誉教授)を中心に展開されてきました。その流れを受けて谷口先生は、人間の発達は個体内で完結するものではなく、複数の知的エージェントが、言葉などの記号を介して相互作用する中で進むものだという視点から、「記号創発ロボティクス」という考え方を提唱されています。この枠組みは、私にとって、人の知能を理解するうえで非常にしっくりくるものでした。 

 

私の研究の特徴は、ロボカップ@ホームのような、人の生活に役立つアプリケーション志向のテーマと記号創発ロボティクスという、人工知能における基礎的・理論的なテーマを両輪として回している点にあります。この二つを行き来しながら研究を進めることを大切にしています。 

 

―今のお話を聞いていて、もともと生活支援ロボットがスタートラインにあって、それを実現するために記号創発の研究と組んで、人と同じようにロボットが発達していかないだろうかという流れになったと捉えました。この認識で合っていますでしょうか。 

 

そうですね。博士後期課程の頃に最初に強い影響を受けたのは、神経科学者デビッド・マー (1945-1980)が著した『ビジョン: 視覚の計算理論と脳内表現』(産業図書)という本でした。この本は、人間の視覚メカニズムを数理的に捉えようとする研究をまとめたもので、私はその考え方に強く惹かれました。そこから、画像処理の研究に取り組み始めたのが研究者としてのスタートです。実際に研究を進める中で、理論だけでなく、具体的なアプリケーションを対象にした方が理解もしやすく、他者にも説明しやすいと感じるようになりました。そのため、研究の初期段階では、アプリケーション寄りのテーマに取り組んでいました。ただ、「本当に役に立つものとは何か」を突き詰めて考えていくと。人間の知覚や認知の仕組みそのものを理解し、数理的に捉えることが重要だと考えるようになりました。そうした問題意識が、現在の研究にもつながっています。 

02

一般の人々の生活を支援するロボットにフォーカス

―生活支援ロボットについて少し深掘りさせてください。萩原先生は生活支援ロボットに立脚されています。具体的にはどういった生活支援を指されていますか。 

 

家庭用の生活支援ロボットとしてよく知られているのが、iRobot社(米国の家庭用ロボットカンパニー)のルンバ(自律型家庭用掃除ロボット)です。iRobotはMITの研究者らにより創業され、ルンバの設計思想には、サブサンプションアーキテクチャー(複雑な知的振る舞いを多数のシンプルな振る舞いモジュールに分割し、振る舞いのモジュールの階層構造を構築する仕組み。ロドニー・ブルックスが提案した概念)が強く反映されています。

 

この方式によって、家庭環境でスタックせずに自動的に掃除をやってくれるのですが、高度な言語理解に基づいて動作する機能は持っていません。言い換えれば、「掃除に特化したロボット」だと言えます。一方で、Alexa(アマゾンが開発した音声アシスタント)やChatGPTOpenAIが公開した大規模言語モデルを用いる対話型生成AIサービス)など、言語を高度に理解して、対話として応答できる人工知能も存在しています。 

 

しかし、言語理解と物理的な作業能力の両方を兼ね備えたロボット、例えば「そこら辺を片付けておいて」と伝えるだけで実際に作業を行ってくれるような掃除ロボットは、まだ十分には実現できていません。現在では、Googleなどの企業が、この分野に注力し、ロボット基盤モデルなどを活用した研究成果を多数報告しています。私は、このようなロボットを生活支援ロボットと呼んでおり、特定の人だけを対象とするのではなく、一般の家庭や人々の生活全体を支える存在として位置づけています。 

 

特にロボカップ@ホームでは、高齢化が進む米国や日本の社会において、高齢者の生活支援や共働き世帯の子育て支援など、日常生活を広く支えることを視野に入れて研究が進められています。 

 

―ロボット、特に今ヒューマノイド(人間型のロボット。人間の動作や形状を模倣する)に関しては、中国がものすごく進んでいます。人の動きも振る舞いをほぼほぼできています。しかし、萩原先生が研究されているような、ロボットが人の依頼内容を理解して自分自身で行動するようにはなるのはまだ先になると思っています。萩原先生としては、そこの知能的な部分、ロボティクスがやはり研究テーマにあると思うのですが、未来においてはロボットと人がコミュニケーションを取りながら、実際に協調して社会生活を営んでいく時代になるのでしょうか。 

 

未来において、そうなることを期待しています。ただ、現状では人がロボットに命令して、その命令を上手く現場環境の知識を使いながら解釈して、何かしら役に立つ行動をするというところに留まっています。将来的には、ロボットがすべてを担うというよりも、人間とロボットがそれぞれの得意分野を活かしながら上手く協調して様々な作業を行う社会になると考えています。 

03

ロボット開発におけるシステム統合を共著書として体系化

青空と白い雲の中を浮遊する、カラフルな柄の熱気球

―2025年2月に萩原先生の共著書『ROS2とPythonで作って学ぶAIロボット入門 改訂第2版』(講談社)が発売されました。この本は、どちらかというと制御系のものになるのでしょうか。 

                 

書籍の「はじめに」でも触れていますが、私はロボカップ@ホームに15年ほど関わってきました。学生と一緒に開発していると、様々な教育上の問題が起こります。特に多かったのが、音声認識、画像認識、ナビゲーション、マニピュレーション等の各機能の分担開発とそれを全体として連携させる部分での問題です。それぞれの要素技術については、専門書やウェブサイトも充実しています。例えば、ROSであれば、Wikiを参照すれば良く、音声認識や画像認識には豊富な専門書があります。それらの資料に従って実装すれば、個別の機能は動作します。しかし、それらを全体として統合する、システムインテグレーションの段階になると。途端に上手くいかなくなります。 

 

なぜ上手くいかないのかというと、音声認識、画像認識、制御など、それぞれの専門が分かれており、「誰がそれをつなぎ合わせるのか」という全体を俯瞰した役割が不在になりがちだからです。そこで、ロボットの行動を決定する「プランニング」の担当者がこの作業を担うのですが、ステートマシン(システムやソフトウェアの状態と状態遷移をモデル化するための手法)などのプランニング技術のみを勉強しても、全体として上手く動きません。複数の機能を統合して動かすには、すべての要素技術についての基礎的な知識と豊富な実装経験が必要となりますが、研究対象になりにくい領域でもあります。そのため、体系的な知識を持つ人が少ないのです。 

 

そこで、ロボカップ@ホームに関わる教員を中心に、キャンプやワークショップ、レクチャーを長年にわたって開催し、実践的な知識やノウハウを共有してきました。その内容の基礎部分が、ROSやPythonだったという背景があります。 

 

そうした取り組みを通じて、「これはどのチームでも共通して使う」「ロボットシステムを作ろうとすると、必要になる」と感じる要素が次第に明確になってきました。そこで、ワークショップやレクチャーに参加しなくても学べるように、皆が共通して押さえておくべき内容を一冊の本としてまとめたのが、この書籍です。そのため、本書は制御系に限定したものではありません。音声認識や画像認識に加えて、プランニングまで含めた、AIロボット全体を扱っています。特にプランニングは、ロボットが実際に役に立つ行動を取るための中核となる要素であり、重要な位置づけだと考えています。 

04

今やプランニングもLLMやAIに置き変わっている

―音声認識やナビゲーションなど、人間の五感的な部分というのは、それぞれかなり研究が進んでいますが、統合的な施策はなかったりします。僕がイメージするのに、そのプランニングという部分では、それこそAIのオーケストレーション(複数の異なるツール・サービスを統合し、IT環境の管理・監視を自動化すること)やAIエージェントがあります。それが幾つか、例えば音声認識やナビゲーション、色々な制御系があったり、オーケストレーションAIみたいな指揮命令系統が、ロボットの世界でも、あるAIが組み立てて行動するということができたりするのでしょうか。

 

私は、まさにその研究に取り組んでいました。2020年当時のプランニングでは、想定されるあらゆる言語指示に対応できるよう、事前にすべての行動パターンをステートマシンとして記述していました。一つひとつの行動がステートとして定義され、その中にROSのノード(ネットワークやシステムを構成し、情報を送受信・処理する接続点やデバイス)が組み込まれる形で実装され、全体を把握するのは困難な規模のプログラムになります。

 

それでも、文法のパターンとしては8通り、物体10種類と場所10カ所を組み合わせると800通りほどの命令にしか対応できません。しかし、実運用の現場では、さらに多様な命令が飛んできます。 

 

この課題が大きく前進したのが、2022年頃にGPTをはじめとする大規模言語モデル(LLM)が普及してからです。ロボカップには、GPSR(General Purpose Service Robot)という、どういう命令が来るかわからないというタスクがあります。以前は100点とか200点程度しか取れなかったのですが、LLMが使えるようになってからは、1000点近いスコアを取るチームも出てきました。 

 

LLMを用いる場合でも、ロボットが持つスキルや環境に関する知識は、あらかじめ整理してLLMに与えておく必要があります。しかし、どのような言語指示が来たとしても、それを達成するための行動系列を柔軟に生成できるため、従来のように膨大なステートマシンを事前に組む必要がなくなりました。まさに、プランニングの部分が、LLMや生成AIに置き換わっているという状態です。 

 

ただし、そのためには環境に関する知識を用意しておく必要があり、これを人手で記述するのは非常に大変です。さらに、実世界の環境に関する知識は、確定的ではなく、不確実で確率的なものを含みます。そうした知識を場所概念獲得の確率的生成モデル(現実世界のデータがどのように生成されるかを確率的にモデル化したもの)を用いて、ロボット自身が獲得・記述するというアプローチを取りました。