cs.CV」カテゴリーアーカイブ

Hierarchical Image Matching for UAV Absolute Visual Localization via Semantic and Structural Constraints

要約 グローバルな参照に関するエージェントの位置を決定することを目的とする絶対的 … 続きを読む

カテゴリー: cs.CV, cs.RO | Hierarchical Image Matching for UAV Absolute Visual Localization via Semantic and Structural Constraints はコメントを受け付けていません

LLM2TEA: Agentic AI Designer Finds Innovative Objects with Generative Evolutionary Multitasking

要約 このホワイトペーパーでは、複数のドメインからのデザインのデザインの相乗効果 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.NE | LLM2TEA: Agentic AI Designer Finds Innovative Objects with Generative Evolutionary Multitasking はコメントを受け付けていません

ComfyUI-R1: Exploring Reasoning Models for Workflow Generation

要約 AIが生成したコンテンツは、モノリシックモデルからモジュラーワークフロー、 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SE | ComfyUI-R1: Exploring Reasoning Models for Workflow Generation はコメントを受け付けていません

One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image

要約 マルチモーダル検索拡張生成(M-RAG)は、事実知識ベース(KB)を使用し … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.CV, cs.IR | One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image はコメントを受け付けていません

Using Shapley interactions to understand how models use structure

要約 言語は複雑に構造化されたシステムであり、NLP解釈可能性の重要な目標は、言 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Using Shapley interactions to understand how models use structure はコメントを受け付けていません

MMME: A Spontaneous Multi-Modal Micro-Expression Dataset Enabling Visual-Physiological Fusion

要約 微小発現(ME)は、個人の真の感情的状態を明らかにする微妙でつかの間の非言 … 続きを読む

カテゴリー: cs.CV | MMME: A Spontaneous Multi-Modal Micro-Expression Dataset Enabling Visual-Physiological Fusion はコメントを受け付けていません

DynaSplat: Dynamic-Static Gaussian Splatting with Hierarchical Motion Decomposition for Scene Reconstruction

要約 複雑で絶えず変化する環境を再構築することは、コンピュータービジョンの中心的 … 続きを読む

カテゴリー: cs.AI, cs.CV | DynaSplat: Dynamic-Static Gaussian Splatting with Hierarchical Motion Decomposition for Scene Reconstruction はコメントを受け付けていません

OctoNav: Towards Generalist Embodied Navigation

要約 具体化されたナビゲーションは、具体化されたAIのより広範な追求内の基礎柱と … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | OctoNav: Towards Generalist Embodied Navigation はコメントを受け付けていません

Learning to Align: Addressing Character Frequency Distribution Shifts in Handwritten Text Recognition

要約 手書きのテキスト認識は、視覚入力を機械可読テキストに変換することを目的とし … 続きを読む

カテゴリー: cs.AI, cs.CV | Learning to Align: Addressing Character Frequency Distribution Shifts in Handwritten Text Recognition はコメントを受け付けていません

Dataset of News Articles with Provenance Metadata for Media Relevance Assessment

要約 コンテキスト外および誤った画像は、今日の誤った情報と偽情報の状況におけるメ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY | Dataset of News Articles with Provenance Metadata for Media Relevance Assessment はコメントを受け付けていません