単一カメラからの3D人体姿勢推定の精度を向上させるため、複数のカメラ映像を訓練時に活用し、推定された3D姿勢の一貫性を確保する。
CAD モデルを参照することで、物体発見と姿勢推定を ゼロショット で実行できる。
Deblur e-NEFRは、高速または低照度条件下で生成された動きぼやけたイベントから、ぼやけのない高品質なNeRFを直接的かつ効果的に再構築することができる。
ドローンに搭載したステレオカメラを使って、YOLO物体検出とSGBM深度推定を統合することで、ラジアタパインの枝の位置と距離を正確に特定し、自動剪定を実現する。
会話型 AI を使ってカメラ操作を実現する
ビデオ監視シナリオにおける人体姿勢と形状の正確な3D推定には、従来のメトリクスが限界があり、世界座標系での位置推定を考慮したメトリクスの必要性が示された。提案手法のRotAvatは、この課題に対処するための効果的なポストプロセッシング手法である。
LiDARデータを3D Gaussian Splattingに統合することで、ボルト、開口部、その他の重要な詳細を正確に捉えることができ、リモートモニタリングや保守などのエンジニアリング分野での活用が期待できる。
顔認証システムにおいて、ウォーターマーキングと敵対的攻撃の組み合わせが、認識性能を大幅に低下させる新たな脆弱性を明らかにした。
AI生成画像と実画像を区別するための新しい検出手法を提案する。従来の手法とは異なり、学習時に合成画像を必要としないため、未知の生成モデルにも適用可能である。
KISS-Matcher は、高速で堅牢な点群登録パイプラインを提供し、スキャンレベルからマップレベルまでの幅広い適用性と優れたスケーラビリティを実現する。