Enable AI Foundry(EAF)とシャープが開催したセマンティックカメラハッカソン「Semantic Camera で未来を創ろう!」で最優秀賞に輝いたのは、IT エンジニア3名で構成されるクリティカルシンキングクルー(CTC)の「スマートセマンティックシールド S3」だった。
コンビニ ATM に設置されたカメラとエッジ AI を組み合わせ、特殊詐欺が成立しない仕組みそのものを ATM に埋め込むというコンセプトだ。
2万件超の特殊詐欺に「仕組み」で対抗する

福永圭佑氏、中澤政孝氏、駒場成美氏の3名からなる CTC が着目したのは、コンビニ ATM を舞台にした特殊詐欺の問題だ。2021年から2023年の3年間で、オレオレ詐欺や還付金詐欺など2万件以上の被害が発生している。警察庁や金融庁が ATM 操作中の通話に対する周知を強化し、大阪府では通話禁止を明確化する条例も登場しているが、現場での対策はコンビニ店員の気付きに依存する部分が大きい。
「ニュースでもコンビニ店長が還付金詐欺を抑止したという話がよく出ますが、人の努力によるものでコストもかかり属人的です。2万件以上ある被害をなるべくゼロに近づけるためには、仕組みで解決するのが良いのではないかと考えました」(福永氏)。
クラウドベースの画像認識を使えばリスク検知は技術的に可能だが、全国の ATM を常時監視するには通信負荷、利用量に応じて増え続けるサービス利用料、プライバシーの懸念など多くのボトルネックがある。
S3 はこれらの課題を、エッジ上のビジュアルランゲージモデル(VLM)で解決する。映像データをクラウドに送信せずエッジで処理を完結させるため、通信負荷やプライバシーの問題が生じず、利用増加に伴うクラウド利用料の青天井も回避できる。セマンティックカメラの「映像を意味に変換し、映像そのものは保持しない」という設計思想と合致するアプローチだ。
覗き込み検知88%、エッジで動く Liquid AI

ピッチでは2つのデモが披露された。1つ目は ATM 操作中に背後からの覗き込みを検知し警告を表示するもの、2つ目はスマホ通話をしながら ATM を操作する行為を検知するものだ。地域の条例や運用方針に応じて、警告のみにするか使用を一時停止させるかなど段階的な介入を設定できる。
技術基盤には Liquid AI のオンデバイス基盤モデルを採用した。MIT の研究者が設計したトランスフォーマー代替アーキテクチャで、従来の大規模モデルでは難しかったオンデバイス動作を実現する。CTC はこのモデルを ATM 犯罪防止向けにチューニングし、約500件の学習データで覗き込み検知において88%以上の精度を達成した。
ATM から無人端末へ、ローカルで守りグローバルに展開

今後の展望として、S3 を ATM 以外のキオスクや券売機、無人受付などへ横展開する構想も描く。単一の検知機能からイベント辞書への拡張を目指し、誤検知を前提とした段階的介入(まず警告、次に一時停止、そしてエスカレーション)を設計する方針だ。シャープとのコラボレーションにより、セマンティックカメラが活用できるあらゆる現場での犯罪抑止を目指す。
ローカルで守り、グローバルに展開する。CTC が掲げたこのビジョンが、最優秀賞の評価につながった。