cs.CV」カテゴリーアーカイブ

DIS-CO: Discovering Copyrighted Content in VLMs Training Data

要約 トレーニングデータに直接アクセスすることなく、著作権で保護されたコンテンツ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2 | DIS-CO: Discovering Copyrighted Content in VLMs Training Data はコメントを受け付けていません

KV-Edit: Training-Free Image Editing for Precise Background Preservation

要約 背景の一貫性は、画像編集タスクにおける重要な課題のままです。 広範な開発に … 続きを読む

カテゴリー: cs.CV | KV-Edit: Training-Free Image Editing for Precise Background Preservation はコメントを受け付けていません

Co-MTP: A Cooperative Trajectory Prediction Framework with Multi-Temporal Fusion for Autonomous Driving

要約 車両からすべての技術(V2X)は、知覚範囲を拡張し、閉塞を通して見るための … 続きを読む

カテゴリー: 68T07, cs.AI, cs.CV, cs.LG, cs.RO, I.2.6 | Co-MTP: A Cooperative Trajectory Prediction Framework with Multi-Temporal Fusion for Autonomous Driving はコメントを受け付けていません

Improving Monocular Visual-Inertial Initialization with Structureless Visual-Inertial Bundle Adjustment

要約 単眼の視覚慣性臭気(VIO)は、センサースイートのサイズが小さいと低消費電 … 続きを読む

カテゴリー: cs.CV, cs.RO | Improving Monocular Visual-Inertial Initialization with Structureless Visual-Inertial Bundle Adjustment はコメントを受け付けていません

Characterizing Structured versus Unstructured Environments based on Pedestrians’ and Vehicles’ Motion Trajectories

要約 互いに近くで動作する歩行者と車両の軌道行動は、構造化された環境と比較して構 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Characterizing Structured versus Unstructured Environments based on Pedestrians’ and Vehicles’ Motion Trajectories はコメントを受け付けていません

Task-Oriented 6-DoF Grasp Pose Detection in Clutters

要約 一般に、人間はさまざまなタスクについてオブジェクトを異なる方法で把握します … 続きを読む

カテゴリー: cs.CV, cs.RO | Task-Oriented 6-DoF Grasp Pose Detection in Clutters はコメントを受け付けていません

Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics

要約 Fiducialマーカーは、さまざまなロボットタスクで広く使用されており、 … 続きを読む

カテゴリー: cs.CV, cs.RO, I.2.10 | Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics はコメントを受け付けていません

Parameter Efficient Merging for Multimodal Large Language Models with Complementary Parameter Adaptation

要約 カスタムデータを使用した事前に訓練されたモデルを微調整すると、特定のタスク … 続きを読む

カテゴリー: cs.CV | Parameter Efficient Merging for Multimodal Large Language Models with Complementary Parameter Adaptation はコメントを受け付けていません

A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis

要約 イメージネットの前提条件-V3ネットワークで計算されたfre \ &#82 … 続きを読む

カテゴリー: cs.CV, cs.LG | A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis はコメントを受け付けていません

ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context

要約 視覚的なストーリーテリングには、キャラクターやシーンの一貫性を維持しながら … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context はコメントを受け付けていません