cs.AI」カテゴリーアーカイブ

MiniGPT-3D: Efficiently Aligning 3D Point Clouds with Large Language Models using 2D Priors

要約 大規模 2D ビジョン言語モデル (2D-LLM) は、単純なプロジェクタ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | MiniGPT-3D: Efficiently Aligning 3D Point Clouds with Large Language Models using 2D Priors はコメントを受け付けていません

FlowBot3D: Learning 3D Articulation Flow to Manipulate Articulated Objects

要約 私たちは、ロボットが目に見えないクラスのオブジェクトを関節表現できるように … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | FlowBot3D: Learning 3D Articulation Flow to Manipulate Articulated Objects はコメントを受け付けていません

Purify Unlearnable Examples via Rate-Constrained Variational Autoencoders

要約 学習不可能なサンプル (UE) は、正しくラベル付けされたトレーニング サ … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Purify Unlearnable Examples via Rate-Constrained Variational Autoencoders はコメントを受け付けていません

Understanding Retrieval-Augmented Task Adaptation for Vision-Language Models

要約 事前トレーニングされた対照的な視覚言語モデルは、幅広いタスクにわたって優れ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Understanding Retrieval-Augmented Task Adaptation for Vision-Language Models はコメントを受け付けていません

Advancing human-centric AI for robust X-ray analysis through holistic self-supervised learning

要約 AI Foundation モデルは、放射線医学などの医療分野を含むさまざ … 続きを読む

カテゴリー: cs.AI, cs.CV | Advancing human-centric AI for robust X-ray analysis through holistic self-supervised learning はコメントを受け付けていません

V-FLUTE: Visual Figurative Language Understanding with Textual Explanations

要約 大規模ビジョン言語モデル (VLM) は、視覚的な質問応答や視覚的な含意な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | V-FLUTE: Visual Figurative Language Understanding with Textual Explanations はコメントを受け付けていません

MANTIS: Interleaved Multi-Image Instruction Tuning

要約 近年、単一画像のビジョン言語タスクを効果的に解決するための、多数の大規模マ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MANTIS: Interleaved Multi-Image Instruction Tuning はコメントを受け付けていません

Continual Diffusion: Continual Customization of Text-to-Image Diffusion with C-LoRA

要約 最近の研究では、いくつかの画像例を提供するだけで、テキストから画像への拡散 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Continual Diffusion: Continual Customization of Text-to-Image Diffusion with C-LoRA はコメントを受け付けていません

A separability-based approach to quantifying generalization: which layer is best?

要約 深層学習の分類モデルと基礎モデルについては、目に見えないデータへの一般化は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.6 | A separability-based approach to quantifying generalization: which layer is best? はコメントを受け付けていません

Improving Intervention Efficacy via Concept Realignment in Concept Bottleneck Models

要約 コンセプト ボトルネック モデル (CBM) は、人間が理解できる概念に基 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Improving Intervention Efficacy via Concept Realignment in Concept Bottleneck Models はコメントを受け付けていません