準備的考察-仮想世界の保有すべき情報量-(投稿テスト)

  • 導入

 これからするのは、自分が今後研究しておくことに対する準備的考察であって、別段公にする必要はないのかもしれない。しかしながら、こういった、自分が他者の知らぬ間に前提としていることは、往々にして研究を大きく色づける。工学の道は広く、一つの問題を解決するのに数多くの手段が存在するのは言うまでもないが、そのどれを選ぶがということは、研究をする者のもつバックグラウンドを大きく反映する。よって私が準備的考察をここに書くのは、今後私の研究を受け取るかもしれない人々に私の持つ背景を伝えることによって、アプローチを合理的に感じてもらおうと、そういうことである。

  • “バーチャルな”金魚の例

 これから私が議論しようとしていることに関して、一つ例を挙げてみよう。

 ここに一つの水槽がある。あなたは金魚を飼いたくて、とりあえず水槽を買ったはいいものの、どうにも自分が生き物をすぐにダメにしてしまうタチだと心得ている。そこで、「現実の金魚を飼うのではなく”バーチャルな”金魚を飼おう」と思いついた。(ここの発想の飛躍は認めるものとせよ)。さて、あなたが飼う”バーチャルな”金魚の持つべき情報量はいったいどれくらいであるか、というのが私の問いである。

 例を続けよう。あなたは適当なAR(拡張現実)の知識を手に入れて、さらには金魚のふるまい(アニメーション)もうまく作れた。ディスプレイを通して見ると、彼はあなたの買った水槽の中で、悠々と泳いでいる。さて、ここであなたは「ちょっと水槽の中が寂しいな」と考える。あなたは水槽しか買っていなかったから、中身はからっぽのままだった。これは自然な発想かと思う。さて、あなたは人工的な水草の模型を買ってきた。これを水槽に落とし込む。しかし、このままだと金魚が水草をすり抜けてしまう。これでは具合が悪い。金魚は水草をさけるべきだ。そのためには、金魚は「そこに水草があること」を”知って”いなければならない。”知って”いなければ、彼は水草をよけることはできない。”見えない”ものをよけるのは無理があるだろう。そこであなたはこう考えた。「人間の目みたいに、カメラを二つ用意すれば、コンピュータも立体的にものを見れるに違いない!」。そして、「カメラ2つで作ったコンピュータの”目”で水槽を見れば、『どこにどんな形のものがあるか』が”バーチャルな”金魚にもわかるはずだ」。

 ここで明記しておきたいのは、このカメラの”目”は、あなたの視点であるということである。ARとはそういう技術である。ARは、あなたが見るであろう物を、いったんカメラで”見て”、”バーチャルな”ものを上書きしてから、あなたに見せる。3人称視点も可能だが、あなたの視点としよう。それが一番自然なように思われる。なぜこの点を言及したかということは後にわかる。

 さて、あなたは再び、適切な知識を得てそれを実現することができた。できたとしよう。コンピュータはカメラの”目”で水槽を見て、水草の形状を”バーチャルな”金魚に伝え、金魚はそれをよけることができるようになった。ここまで来ればしめたものである。もうあなたが水槽の中に何を置こうと、カメラの”目”によって形状を把握し、金魚はそれを知ることができる。さあ色々なものを置いてみよう。手にした技術を様々に適用するのは良いことである。ふと考えた。「金魚の隠れ家がほしいな」。あなたは植木鉢を伏せた状態で水槽に沈めた。

 どうにもおかしい、ということにあなたは気づくであろう。金魚が隠れ家の中に入ってくれないのである。せっかく用意したのにこれでは台無しだ。なぜだろう。考えてみればこれは当然のことである。今、金魚は「カメラの目」を通して水槽を見ている。しかし「カメラの目」では、伏せてある植木鉢の内部を見ることはできない。”バーチャルな”金魚は、植木鉢の内部に空間があることを知らないから、入っていくことができないのだ。

 ここにきて、さきに明記したことが利いてくる。現実の金魚が「金魚自身の視点」をもっているのに対して、ここで”バーチャルな”金魚が持っているのは「あなたの視点」である。”バーチャルな”金魚がよりリアルに振る舞うためには、金魚自身の視点が不可欠なのである。さらに、金魚が複数いたらどうか。それぞれの金魚が自然に振る舞うためには、それぞれの視点を持っていなければならないであろう。ここに、仮想世界の持つべき情報量は膨れ上がる。と、私は考える。

  • まとめ

 こんなに長々と文章を書いておいて、私が結局何を伝えたかったのかというと、それは「私が画像処理による空間把握をしない理由」である。前述したように、画像処理による現実空間の形状取得は、情報源をカメラ映像にしているため、そのカメラから見える範囲の情報しか取得できない。空間の部分的な形状を知ることしかできない。しかし、私は仮想的な物体やキャラクターが自然に振る舞うために、彼らの視点も取得したい。あるいは「彼らが見るであろう物」を知りたい、とも言い換えられる。それには、自分が考えたい一定の領域(例えばある一室)のすべての物体の位置情報を取得して、ようやく足りるように思われる。そうなってくると、カメラを一つ一つ敷設してカメラの死角を埋めるやり方はいささか冗長に思えてくる。

 加えて、これは前述しなかったが、画像処理では物体と物体の境目を見分けるのが困難である。我々は知らず知らずに「机」の上にある「本」を分離された、別々の物体としてとらえているが、視覚情報だけでコンピュータにそれをさせるのは困難である。人間の持つ「経験則」だとか「先入観」というものを、コンピュータは持ち合わせない。さらに、画像処理では物体の持つ諸特性を把握できない。これは当然のことであるし、画像処理畑でそれをできる必要はないだろう。単に「”私は”物体の持つ諸特性を知りたい」というだけの話である。私は仮想的な物体やキャラクターが「見るであろう物」に加えて「体験するであろうこと」までもを知りたいのである。

 そこで私が考えているのは、「現実の物体に、その物体に関するいくつかの情報を持つ固有のチップのようなものを内蔵させ、その情報を通信によってコンピュータに伝える」というやり方である。物体の情報としては、形状情報、ボーン、重さ、などに加えて「位置と姿勢」も持たせたいと考えている。(この、位置と姿勢の情報は、各物体が逐次、何かしらの方法——たとえばLocal Positioning System——によって、外部との相対関係を取得する必要がある。)

 このやり方の難点は、チップを持たない物体をコンピュータは認識できないという点である。この手法を限られた空間内以外でも適用しようと思うと、チップの普及が不可欠である。しかしながら、その点も私はうまくいくのではないかと考えている。幸いにして、現在産業界ではIoT(Internet of Things)のブームが来ている。このブームに乗っかって、うまく一般に普及させられるのではないか、と希望的観測をしてる。私の目標の一つは、「AR + IoT」といえるかもしれない。

 私は、仮想世界をよりリアルにするために、コンピュータは人間が知覚する以上の情報を持っている必要があると考える。空間的な情報や特性的な情報を持つのはもちろん、物理エンジンなどのシミュレーションによってある程度の未来(体験されるであろうこと)を知ることも必要になってくると考える。仮想世界を真に実現するためには、仮想世界が文字通りの”世界“である必要があるのだ。”Virtual” RealityをRealityにするとはそのような作業である。Virtualが”仮想”と訳されてしまったのは実に惜しいことである。

 

以上のように私は考えるのだが、皆さんはどうだろうか。

この記事を通して、私の持つバックグラウンド(知識、偏見などを含む)の一部を理解していただけたなら幸いである。

Posted on