cs.CV」カテゴリーアーカイブ

Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning

要約 このペーパーは、動的および乱雑な環境での自律的なナビゲーションに向けて大規 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning はコメントを受け付けていません

Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training

要約 注釈付きのデータセットは、オブジェクトの検出のためにニューラルネットワーク … 続きを読む

カテゴリー: cs.CV, cs.RO | Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training はコメントを受け付けていません

SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping

要約 3Dロボット操作の最近の進歩により、日常のオブジェクトの把握が改善されまし … 続きを読む

カテゴリー: cs.CV, cs.RO | SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping はコメントを受け付けていません

CIVET: Systematic Evaluation of Understanding in VLMs

要約 ビジョン言語モデル(VLM)はさまざまなタスクで競争力のあるパフォーマンス … 続きを読む

カテゴリー: cs.CL, cs.CV | CIVET: Systematic Evaluation of Understanding in VLMs はコメントを受け付けていません

AnyTop: Character Animation Diffusion with Any Topology

要約 任意のスケルトンの動きを生成することは、コンピューターグラフィックスの長年 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | AnyTop: Character Animation Diffusion with Any Topology はコメントを受け付けていません

Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models

要約 テキストから画像の生成におけるオブジェクト数を正確に制御することは、依然と … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models はコメントを受け付けていません

Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis

要約 Pathology Foundationモデル(PFM)は、スライド画像全 … 続きを読む

カテゴリー: cs.CV | Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis はコメントを受け付けていません

MokA: Multimodal Low-Rank Adaptation for MLLMs

要約 この論文では、現在の最新のマルチモーダル微調整方法が主要な制限によって妨げ … 続きを読む

カテゴリー: cs.CV | MokA: Multimodal Low-Rank Adaptation for MLLMs はコメントを受け付けていません

Vision-Based Autonomous MM-Wave Reflector Using ArUco-Driven Angle-of-Arrival Estimation

要約 非表示(NLOS)条件における信頼できるミリ波(MMWAVE)コミュニケー … 続きを読む

カテゴリー: cs.CV | Vision-Based Autonomous MM-Wave Reflector Using ArUco-Driven Angle-of-Arrival Estimation はコメントを受け付けていません

Quantifying Cross-Modality Memorization in Vision-Language Models

要約 トレーニング中にニューラルネットワークがどのように、どのように覚えているか … 続きを読む

カテゴリー: cs.CV, cs.LG | Quantifying Cross-Modality Memorization in Vision-Language Models はコメントを受け付けていません