-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
SlowFastVAD: Video Anomaly Detection via Integrating Simple Detector and RAG-Enhanced Vision-Language Model
要約 ビデオアノマリー検出(VAD)は、ビデオで予期しないイベントを特定すること … 続きを読む
カテゴリー: cs.CV
SlowFastVAD: Video Anomaly Detection via Integrating Simple Detector and RAG-Enhanced Vision-Language Model はコメントを受け付けていません
InstructEngine: Instruction-driven Text-to-Image Alignment
要約 補強材/AIフィードバック(RLHF/RLAIF)からの学習は、テキストか … 続きを読む
カテゴリー: cs.CV
InstructEngine: Instruction-driven Text-to-Image Alignment はコメントを受け付けていません
HOMER: Homography-Based Efficient Multi-view 3D Object Removal
要約 3Dオブジェクトの削除は、3Dシーンの編集で重要なサブタスクであり、シーン … 続きを読む
カテゴリー: cs.CV
HOMER: Homography-Based Efficient Multi-view 3D Object Removal はコメントを受け付けていません
LL-Gaussian: Low-Light Scene Reconstruction and Enhancement via Gaussian Splatting for Novel View Synthesis
要約 低光光シーンでの新規ビュー合成(NVS)は、重度のノイズ、低ダイナミックレ … 続きを読む
カテゴリー: cs.CV
LL-Gaussian: Low-Light Scene Reconstruction and Enhancement via Gaussian Splatting for Novel View Synthesis はコメントを受け付けていません
PSGait: Gait Recognition using Parsing Skeleton
要約 歩行認識は、その非侵入性と閉塞への回復力のために、堅牢な生体認証モダリティ … 続きを読む
カテゴリー: cs.CV
PSGait: Gait Recognition using Parsing Skeleton はコメントを受け付けていません
Benchmarking 3D Human Pose Estimation Models Under Occlusions
要約 このペーパーでは、閉塞、カメラの位置、および作用の変動に対する既存のモデル … 続きを読む
カテゴリー: cs.CV
Benchmarking 3D Human Pose Estimation Models Under Occlusions はコメントを受け付けていません
Multimodal Representation Learning Techniques for Comprehensive Facial State Analysis
要約 マルチモーダルファンデーションモデルは、複数のモダリティから情報を統合する … 続きを読む
カテゴリー: cs.CV
Multimodal Representation Learning Techniques for Comprehensive Facial State Analysis はコメントを受け付けていません
GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion
要約 スマートフォンなどのコモディティデバイスが撮影した単眼動画から、アニメーシ … 続きを読む
ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements
要約 基礎ビジョン言語モデル(VLM)の最近の進歩により、コンピュータービジョン … 続きを読む
カテゴリー: cs.CV
ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements はコメントを受け付けていません
Patch and Shuffle: A Preprocessing Technique for Texture Classification in Autonomous Cementitious Fabrication
要約 自律的な製造システムは、建設と製造を変革していますが、印刷エラーに対して脆 … 続きを読む
カテゴリー: cs.CV
Patch and Shuffle: A Preprocessing Technique for Texture Classification in Autonomous Cementitious Fabrication はコメントを受け付けていません