第30回の当ブログでご紹介した通り、PicoCELAのメッシュWi-Fiデバイス・PCWLシリーズはWi-Fiアクセスポイントの機能に加えて、エッジコンピュータとして様々なアプリケーションを動作させることができます。Wi-Fiアクセスポイントは元来、Wi-Fi空間を作るための無線設備ですが、人々のすぐ近くで活躍するコンピュータでもあります。これらが知覚や知能を持てば様々なサービスが提供できるようになるでしょう。
しかし、このようなAI処理は膨大な計算を必要とするため、PCWLに搭載されたCPUだけでは実行可能な処理に限界があります。そこで、今回のブログでは、弊社の屋内ハイエンドメッシュWi-Fiエッジコンピュータ「PCWL-0500」にAIチップを試験的に実装し、物体認識AIをPCWL上で動作させる実験を行ってみました。
実験で用いるAIチップは、エッジデバイス向けに設計された推論用のNPU(Nural Processing Unit)で、イスラエルHailo社のH8です。H8は26TOPSの処理能力を持ちます。一秒間に5000人分の顔認識ができるくらいの性能レベルです。なお、最新のApple MAC book proに採用されているM4チップに搭載されるNPUの性能は38TOPSとのこと、その7割くらいの性能ということになります。
H8チップが搭載されたm.2モジュールを、PCWL-0500の内臓拡張スロットに挿します。この拡張スロットには、元来、bluetoothチップが搭載されていますが、今回これをH8へと換装します(※注 )
※注 本体の改造を伴うので、本ブログで実施した実験はすべて電波暗箱内で行いました。お客様ご自身での同様の改造は、電波法上の問題はもとより、漏電による火災や製品不具合を生じさせる原因となりますので絶対に行わないでください。当社は改造によって生じたいかなる不具合や損害に対しても保証いたしませんのでご注意ください。

(写真)H8が実装されたm.2モジュールをPCWL-0500のメインボードに装着。モジュールの大きさは500円玉が収まる程度である。
PCWL-0500のUSBポートにカメラを接続し、撮影された画像をリアルタイムで認識します。映像認識処理をH8を使ってアクセラレートします。
物体認識AIにはポピュラーなYOLOv8を利用しました。実験で使用したトレーニング済みのAIモデルは、物体識別種類数が80個、パラメータ数26M(0.026B)でトレーニングした50MBのweightファイルのものです。
NPUとカメラを搭載したPCWL-0500をブランチモードで動作させて画像認識を行ってみました。一例を以下に示します。

(写真)オフィス内のスナップショット写真とその認識結果
人や椅子、モニターなどが認識されている様子が分かります。また、認識された物体のテキストベースのオブジェクト情報はタイムスタンプとともに定期的にファイルに出力されます。これらの時系列データを分析すれば、人や物体の動きを把握できます。
カメラの解像度は320x240ピクセル、フレームレートは5FPS(つまり、1秒間に5フレームの映像をAIで認識)としました。このときの画像認識処理にかかるCPU負荷の増大は約4%でした。画像認識処理の大部はNPUで実行されますが、NPUへのデータの入出力処理等によりCPU負荷も増大します。しかし、バックホール回線スループットの劣化はほとんど観測されませんでした。無線通信を最大スループット状態で行った場合のCPU負荷率は平均10%程度であり、CPU利用率にはもともと余裕がありますので、通信系の処理を圧迫することなく画像認識処理に伴うCPUの負荷増大を吸収できたと理解されます。なお、画像認識処理にかかる消費電力の増加量は約1Wでした。
今回のNPUによる画像認識AIは、最大でフレームレート40FPSまで対応できました。これに対して、NPUを使わない場合、つまり、PCWL-0500のCPUのみを使って画像認識AIを実行した場合の最大フレームレートはわずか0.15FPSでした。NPUによって、画像認識処理時間を1/267に短縮することができました。凄まじいNPUの効果ですね!
エッジAIは、メッシュWi-FIで構築される広大なWi-Fi空間を単なるスマホとインターネットとの橋渡しを行うための空間に留めるのではなく、様々なサービスも一緒に提供できる高付加価値空間へと変貌させる可能性を秘めた機能と言えるでしょう。
本ブログでは、今後も、エッジAIの可能性や応用について様々な角度から取り上げていきたいと思います。
著者

PicoCELA株式会社
代表取締役社長 古川 浩
NEC、九州大学教授を経て現職。九大在職中にPicoCELAを創業。
一貫して無線通信システムの研究開発ならびに事業化に従事。工学博士。