cs.CV」カテゴリーアーカイブ

MineInsight: A Multi-sensor Dataset for Humanitarian Demining Robotics in Off-Road Environments

要約 人道的脱出におけるロボット工学の使用には、地雷検出能力を改善するためのコン … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning

要約 このペーパーは、動的および乱雑な環境での自律的なナビゲーションに向けて大規 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | コメントする

Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training

要約 注釈付きのデータセットは、オブジェクトの検出のためにニューラルネットワーク … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping

要約 3Dロボット操作の最近の進歩により、日常のオブジェクトの把握が改善されまし … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

CIVET: Systematic Evaluation of Understanding in VLMs

要約 ビジョン言語モデル(VLM)はさまざまなタスクで競争力のあるパフォーマンス … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

AnyTop: Character Animation Diffusion with Any Topology

要約 任意のスケルトンの動きを生成することは、コンピューターグラフィックスの長年 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | コメントする

Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models

要約 テキストから画像の生成におけるオブジェクト数を正確に制御することは、依然と … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントする

Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis

要約 Pathology Foundationモデル(PFM)は、スライド画像全 … 続きを読む

カテゴリー: cs.CV | コメントする

MokA: Multimodal Low-Rank Adaptation for MLLMs

要約 この論文では、現在の最新のマルチモーダル微調整方法が主要な制限によって妨げ … 続きを読む

カテゴリー: cs.CV | コメントする

Vision-Based Autonomous MM-Wave Reflector Using ArUco-Driven Angle-of-Arrival Estimation

要約 非表示(NLOS)条件における信頼できるミリ波(MMWAVE)コミュニケー … 続きを読む

カテゴリー: cs.CV | コメントする