cs.AI」カテゴリーアーカイブ

ViscoNet: Bridging and Harmonizing Visual and Textual Conditioning for ControlNet

要約 この文書では、空間と視覚を同時に調整するための新しい 1 ブランチ アダプ … 続きを読む

カテゴリー: cs.AI, cs.CV | ViscoNet: Bridging and Harmonizing Visual and Textual Conditioning for ControlNet はコメントを受け付けていません

ACCELERATION: Sequentially-scanning DECT Imaging Using High Temporal Resolution Image Reconstruction And Temporal Extrapolation

要約 デュアルエネルギーコンピュータ断層撮影法 (DECT) は、個別化された正 … 続きを読む

カテゴリー: cs.AI, cs.CV, physics.ins-det, physics.med-ph | ACCELERATION: Sequentially-scanning DECT Imaging Using High Temporal Resolution Image Reconstruction And Temporal Extrapolation はコメントを受け付けていません

MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains

要約 ビジョンと言語ナビゲーション (VLN) タスクでは、エージェントは自然言 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains はコメントを受け付けていません

Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery

要約 コンセプト ボトルネック モデル (CBM) は、まず画像を人間が理解でき … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery はコメントを受け付けていません

VisualAgentBench: Towards Large Multimodal Models as Visual Foundation Agents

要約 大規模マルチモーダル モデル (LMM) は、言語と視覚の両方の機能を統合 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VisualAgentBench: Towards Large Multimodal Models as Visual Foundation Agents はコメントを受け付けていません

Rag and Roll: An End-to-End Evaluation of Indirect Prompt Manipulations in LLM-based Application Frameworks

要約 取得拡張生成 (RAG) は、分布外の知識をモデルに装備するために一般的に … 続きを読む

カテゴリー: cs.AI, cs.CR | Rag and Roll: An End-to-End Evaluation of Indirect Prompt Manipulations in LLM-based Application Frameworks はコメントを受け付けていません

AI and Machine Learning Driven Indoor Localization and Navigation with Mobile Embedded Systems

要約 屋内ナビゲーションは、屋内空間における人間、自動運転車、ドローン、ロボット … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | AI and Machine Learning Driven Indoor Localization and Navigation with Mobile Embedded Systems はコメントを受け付けていません

Visual Representation Learning with Stochastic Frame Prediction

要約 将来のフレームを予測することによる画像表現の自己教師あり学習は有望な方向性 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Visual Representation Learning with Stochastic Frame Prediction はコメントを受け付けていません

Embodied Uncertainty-Aware Object Segmentation

要約 不確実性を認識したオブジェクト インスタンス セグメンテーション (Unc … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Embodied Uncertainty-Aware Object Segmentation はコメントを受け付けていません

RuleFuser: An Evidential Bayes Approach for Rule Injection in Imitation Learned Planners for Robustness under Distribution Shifts

要約 自動運転のための現代のモーション プランナーは、専門家の運転ログから引き出 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | RuleFuser: An Evidential Bayes Approach for Rule Injection in Imitation Learned Planners for Robustness under Distribution Shifts はコメントを受け付けていません