cs.AI」カテゴリーアーカイブ

Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models

要約 最近のテキスト間拡散モデルは、視覚的な生成タスクの範囲を強化するために効果 … 続きを読む

カテゴリー: cs.AI, cs.CV | Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models はコメントを受け付けていません

Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement

要約 このホワイトペーパーでは、RGB-Dカメラのみを使用してテーブルトップの片 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement はコメントを受け付けていません

A novel approach to navigate the taxonomic hierarchy to address the Open-World Scenarios in Medicinal Plant Classification

要約 この記事では、問題をオープンクラスの問題として提起することにより、植物の階 … 続きを読む

カテゴリー: cs.AI, cs.CV | A novel approach to navigate the taxonomic hierarchy to address the Open-World Scenarios in Medicinal Plant Classification はコメントを受け付けていません

AnyTop: Character Animation Diffusion with Any Topology

要約 任意のスケルトンの動きを生成することは、コンピューターグラフィックスの長年 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | AnyTop: Character Animation Diffusion with Any Topology はコメントを受け付けていません

DIS-CO: Discovering Copyrighted Content in VLMs Training Data

要約 トレーニングデータに直接アクセスすることなく、著作権で保護されたコンテンツ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2 | DIS-CO: Discovering Copyrighted Content in VLMs Training Data はコメントを受け付けていません

RELICT: A Replica Detection Framework for Medical Image Generation

要約 深い学習モデルの一般化を強化し、改善するための合成医療データの可能性にもか … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | RELICT: A Replica Detection Framework for Medical Image Generation はコメントを受け付けていません

Experimental validation of UAV search and detection system in real wilderness environment

要約 Search and Rescue(SAR)ミッションには、特に挑戦的また … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO, cs.SY, eess.SY | Experimental validation of UAV search and detection system in real wilderness environment はコメントを受け付けていません

MLLMs Know Where to Look: Training-free Perception of Small Visual Details with Multimodal LLMs

要約 マルチモーダル大手言語モデル(MLLM)は、近年、視覚認識タスクの急速な進 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MLLMs Know Where to Look: Training-free Perception of Small Visual Details with Multimodal LLMs はコメントを受け付けていません

FACTR: Force-Attending Curriculum Training for Contact-Rich Policy Learning

要約 ボックスピックアップやローリング生地など、人間が実行する多くのコンタクトリ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | FACTR: Force-Attending Curriculum Training for Contact-Rich Policy Learning はコメントを受け付けていません

V-HOP: Visuo-Haptic 6D Object Pose Tracking

要約 人間は、操作中に堅牢なオブジェクト知覚のために視覚と触覚を自然に統合します … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | V-HOP: Visuo-Haptic 6D Object Pose Tracking はコメントを受け付けていません