cs.CV」カテゴリーアーカイブ

Skeleton-Based Human Action Recognition with Noisy Labels

要約 人間と空間を共有する支援ロボットにとって、次のインタラクションについて情報 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Skeleton-Based Human Action Recognition with Noisy Labels はコメントを受け付けていません

Towards Activated Muscle Group Estimation in the Wild

要約 この論文では、野生での身体活動中に活動している筋肉領域を特定することを目的 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Towards Activated Muscle Group Estimation in the Wild はコメントを受け付けていません

MambaMOS: LiDAR-based 3D Moving Object Segmentation with Motion-aware State Space Model

要約 LiDAR ベースの移動物体セグメンテーション (MOS) は、以前のスキ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.RO, eess.IV | MambaMOS: LiDAR-based 3D Moving Object Segmentation with Motion-aware State Space Model はコメントを受け付けていません

Understanding Retrieval Robustness for Retrieval-Augmented Image Captioning

要約 画像キャプション用の検索拡張モデルの最近の進歩により、強力なドメイン転送機 … 続きを読む

カテゴリー: cs.CL, cs.CV | Understanding Retrieval Robustness for Retrieval-Augmented Image Captioning はコメントを受け付けていません

BodySLAM: A Generalized Monocular Visual SLAM Framework for Surgical Applications

要約 内視鏡手術は 2 次元のビューに依存しているため、外科医にとっては深さの認 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | BodySLAM: A Generalized Monocular Visual SLAM Framework for Surgical Applications はコメントを受け付けていません

Prototype Learning for Micro-gesture Classification

要約 このペーパーでは、IJCAI 2024 の MiGA チャレンジにおけるマ … 続きを読む

カテゴリー: cs.CV | Prototype Learning for Micro-gesture Classification はコメントを受け付けていません

Multi-Agent 3D Map Reconstruction and Change Detection in Microgravity with Free-Flying Robots

要約 国際宇宙ステーション (ISS) にある NASA の Astrobee … 続きを読む

カテゴリー: cs.CV, cs.RO | Multi-Agent 3D Map Reconstruction and Change Detection in Microgravity with Free-Flying Robots はコメントを受け付けていません

Source-Free Domain-Invariant Performance Prediction

要約 モデルのパフォーマンスを正確に推定することは、特にソース ドメインとターゲ … 続きを読む

カテゴリー: cs.CV | Source-Free Domain-Invariant Performance Prediction はコメントを受け付けていません

Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline

要約 既存の植物病害分類モデルは、研究室内の病害画像の認識において顕著な性能を達 … 続きを読む

カテゴリー: cs.CV | Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline はコメントを受け付けていません

FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation

要約 大規模なテキストから画像への拡散モデルは、生成 AI とマルチモーダル テ … 続きを読む

カテゴリー: cs.AI, cs.CV | FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation はコメントを受け付けていません