「cs.CV」カテゴリーアーカイブ

Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning

投稿日: 2025年6月6日作成者: jarxiv

要約このペーパーは、動的および乱雑な環境での自律的なナビゲーションに向けて大規 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training

投稿日: 2025年6月6日作成者: jarxiv

要約注釈付きのデータセットは、オブジェクトの検出のためにニューラルネットワーク … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping

投稿日: 2025年6月6日作成者: jarxiv

要約 3Dロボット操作の最近の進歩により、日常のオブジェクトの把握が改善されまし … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

CIVET: Systematic Evaluation of Understanding in VLMs

投稿日: 2025年6月6日作成者: jarxiv

要約ビジョン言語モデル（VLM）はさまざまなタスクで競争力のあるパフォーマンス … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

AnyTop: Character Animation Diffusion with Any Topology

投稿日: 2025年6月6日作成者: jarxiv

要約任意のスケルトンの動きを生成することは、コンピューターグラフィックスの長年 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models

投稿日: 2025年6月6日作成者: jarxiv

要約テキストから画像の生成におけるオブジェクト数を正確に制御することは、依然と … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis

投稿日: 2025年6月6日作成者: jarxiv

要約 Pathology Foundationモデル（PFM）は、スライド画像全 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MokA: Multimodal Low-Rank Adaptation for MLLMs

投稿日: 2025年6月6日作成者: jarxiv

要約この論文では、現在の最新のマルチモーダル微調整方法が主要な制限によって妨げ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Vision-Based Autonomous MM-Wave Reflector Using ArUco-Driven Angle-of-Arrival Estimation

投稿日: 2025年6月6日作成者: jarxiv

要約非表示（NLOS）条件における信頼できるミリ波（MMWAVE）コミュニケー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Quantifying Cross-Modality Memorization in Vision-Language Models

投稿日: 2025年6月6日作成者: jarxiv

要約トレーニング中にニューラルネットワークがどのように、どのように覚えているか … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning

Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training

SR3D: Unleashing Single-view 3D Reconstruction for Transparent and Specular Object Grasping

CIVET: Systematic Evaluation of Understanding in VLMs

AnyTop: Character Animation Diffusion with Any Topology

Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models

Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis

MokA: Multimodal Low-Rank Adaptation for MLLMs

Vision-Based Autonomous MM-Wave Reflector Using ArUco-Driven Angle-of-Arrival Estimation

Quantifying Cross-Modality Memorization in Vision-Language Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー