cs.CV」カテゴリーアーカイブ

A Survey of Embodied Learning for Object-Centric Robotic Manipulation

要約 オブジェクト中心のロボット操作のための身体化学習は、身体化 AI において … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | A Survey of Embodied Learning for Object-Centric Robotic Manipulation はコメントを受け付けていません

RaNDT SLAM: Radar SLAM Based on Intensity-Augmented Normal Distributions Transform

要約 レスキューロボット工学では、構造化されておらず、視覚が否定される可能性があ … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.SP | RaNDT SLAM: Radar SLAM Based on Intensity-Augmented Normal Distributions Transform はコメントを受け付けていません

ML-Mamba: Efficient Multi-Modal Large Language Model Utilizing Mamba-2

要約 マルチモーダル大規模言語モデル (MLLM) は、その多機能性で大きな注目 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | ML-Mamba: Efficient Multi-Modal Large Language Model Utilizing Mamba-2 はコメントを受け付けていません

Self-Supervised Visual Preference Alignment

要約 この論文は、視覚言語モデル (VLM) における教師なしの好みの調整に向け … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Self-Supervised Visual Preference Alignment はコメントを受け付けていません

Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities

要約 モデルのマージは、機械学習コミュニティにおける効率的なエンパワーメント手法 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities はコメントを受け付けていません

Multi-Grained Query-Guided Set Prediction Network for Grounded Multimodal Named Entity Recognition

要約 Grounded Multimodal Named Entity Reco … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | Multi-Grained Query-Guided Set Prediction Network for Grounded Multimodal Named Entity Recognition はコメントを受け付けていません

FALIP: Visual Prompt as Foveal Attention Boosts CLIP Zero-Shot Performance

要約 CLIP は、画像とテキストのペアのデータで構成される大規模なデータセット … 続きを読む

カテゴリー: cs.CV | FALIP: Visual Prompt as Foveal Attention Boosts CLIP Zero-Shot Performance はコメントを受け付けていません

Hierarchical Salient Patch Identification for Interpretable Fundus Disease Localization

要約 医用画像解析におけるディープラーニング技術の応用の広がりに伴い、モデル予測 … 続きを読む

カテゴリー: cs.CV | Hierarchical Salient Patch Identification for Interpretable Fundus Disease Localization はコメントを受け付けていません

A New Chinese Landscape Paintings Generation Model based on Stable Diffusion using DreamBooth

要約 この研究では主に、中国の山水画を生成するための安定拡散モデル (SDM) … 続きを読む

カテゴリー: cs.CV | A New Chinese Landscape Paintings Generation Model based on Stable Diffusion using DreamBooth はコメントを受け付けていません

ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context

要約 ビジュアルストーリーテリングでは、文字とシーンの一貫性を維持しながら、テキ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context はコメントを受け付けていません