RVOによる衝突回避アルゴリズム

衝突回避のアルゴリズムの一つである RVO (Reciprocal Velocity Obstacles) について、日本語の資料が見当たらないので書いておく。

元論文：http://gamma.cs.unc.edu/RVO/icra2008.pdf

背景

先行のアルゴリズムとして VO (Velocity Obstacles) があったが、VOではエージェントの速度が振動する挙動があった。RVOはその問題を解消するものとなっている。

エージェントA,Bが速度 $v_A, v_B$ で位置 $p_A, p_B$ にいるとして、それぞれの位置を基準としたA,B上の点（位置ベクトル）の集合を $R_A, R_B$ とする。 $p_A + R_A = \{ P_A + r_A \ |\ r_A \in R_A \}$ で現在のA上の点の集合を表すことができる。時間が $t$ だけ経過した後は $p_A + t v_A + R_A$ となるので、A,Bが衝突することは

$\displaystyle (p_A + t v_A + R_A) \cap (p_B + t v_B + R_B) \neq \emptyset$

が成り立つことと言える。これは

$\displaystyle p_A + t v_A + r_A = p_B + t v_B + r_B$

となる $r_A \in R_A, r_B \in R_B$ がそれぞれ存在することと同値で、

$\displaystyle p_A + t (v_A - v_B) = p_B + r_B - r_A$

と整理できる。つまり $p_A$ から相対速度 $v_A - v_B$ の方向に延びる半直線（時間は巻き戻らないので $t > 0$ ）と、 $p_B + R_B - R_A$ （Aの形の情報をBの方に押しつけたもの）が交わるとき、AとBは衝突する。そのような $v_A$ の集合を $VO^{A}_{B}(v_B)$ で表し、各々このVOの外側の速度を選ぶことによる衝突回避がVOによるアルゴリズムである。