-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Pixel Is Not A Barrier: An Effective Evasion Attack for Pixel-Domain Diffusion Models
要約 拡散モデルは、高品質の画像合成のための強力な生成モデルとして登場し、その後 … 続きを読む
カテゴリー: cs.CV
Pixel Is Not A Barrier: An Effective Evasion Attack for Pixel-Domain Diffusion Models はコメントを受け付けていません
EmbodiedSAM: Online Segment Any 3D Thing in Real Time
要約 具現化されたタスクでは、エージェントが探索と同時に 3D シーンを完全に理 … 続きを読む
SEA: Supervised Embedding Alignment for Token-Level Visual-Textual Integration in MLLMs
要約 マルチモーダル大規模言語モデル (MLLM) は、最近、顕著な知覚能力と推 … 続きを読む
カテゴリー: cs.CV
SEA: Supervised Embedding Alignment for Token-Level Visual-Textual Integration in MLLMs はコメントを受け付けていません
SynPlay: Importing Real-world Diversity for a Synthetic Human Dataset
要約 現実世界における人間の外見の多様性を引き出すことを目的とした、新しい合成人 … 続きを読む
カテゴリー: cs.CV
SynPlay: Importing Real-world Diversity for a Synthetic Human Dataset はコメントを受け付けていません
GRAB: A Challenging GRaph Analysis Benchmark for Large Multimodal Models
要約 大規模マルチモーダル モデル (LMM) は、多くの視覚的なタスクにわたっ … 続きを読む
カテゴリー: cs.CV
GRAB: A Challenging GRaph Analysis Benchmark for Large Multimodal Models はコメントを受け付けていません
LongVILA: Scaling Long-Context Visual Language Models for Long Videos
要約 ロングコンテキスト機能は、マルチモーダル基盤モデル、特に長時間のビデオを理 … 続きを読む
Generative AI in Industrial Machine Vision — A Review
要約 マシン ビジョンは、機械が視覚データを解釈し、それに基づいて動作できるよう … 続きを読む
V-RoAst: A New Dataset for Visual Road Assessment
要約 道路交通事故は毎年何百万人もの死者を出しており、特に低・中所得国(LMIC … 続きを読む
D$^3$FlowSLAM: Self-Supervised Dynamic SLAM with Flow Motion Decomposition and DINO Guidance
要約 この論文では、動的コンポーネントを正確に識別しながら動的シーンで堅牢に動作 … 続きを読む