cs.AI」カテゴリーアーカイブ

Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models?

要約 多言語の大規模言語モデルは、さまざまな言語の話者に対応できるように設計され … 続きを読む

カテゴリー: cs.AI, cs.CL | Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models? はコメントを受け付けていません

UDC: A Unified Neural Divide-and-Conquer Framework for Large-Scale Combinatorial Optimization Problems

要約 シングルステージのニューラル組み合わせ最適化ソルバーは、専門知識を必要とせ … 続きを読む

カテゴリー: cs.AI, cs.NE | UDC: A Unified Neural Divide-and-Conquer Framework for Large-Scale Combinatorial Optimization Problems はコメントを受け付けていません

HydraViT: Stacking Heads for a Scalable ViT

要約 ビジョン トランスフォーマー (ViT) のアーキテクチャ、特にマルチヘッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | HydraViT: Stacking Heads for a Scalable ViT はコメントを受け付けていません

Transferring disentangled representations: bridging the gap between synthetic and real images

要約 データ生成メカニズムの基本構造を分離する、意味のある効率的な表現を開発する … 続きを読む

カテゴリー: cs.AI, cs.CV | Transferring disentangled representations: bridging the gap between synthetic and real images はコメントを受け付けていません

IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning

要約 画像キャプションの最近の進歩により、画像とテキストのペアのデータの制限を克 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning はコメントを受け付けていません

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

要約 再訪問した場所を正確に認識することは、実体化したエージェントが位置を特定し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.RO | Revisit Anything: Visual Place Recognition via Image Segment Retrieval はコメントを受け付けていません

Visual Data Diagnosis and Debiasing with Concept Graphs

要約 今日の深層学習モデルの広範な成功は、サイズと複雑さが大幅に異なる広範なデー … 続きを読む

カテゴリー: cs.AI, cs.CV | Visual Data Diagnosis and Debiasing with Concept Graphs はコメントを受け付けていません

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

要約 画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む

カテゴリー: cs.AI, cs.CV | FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction はコメントを受け付けていません

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

要約 衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation はコメントを受け付けていません

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

要約 知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models はコメントを受け付けていません