「cs.AI」カテゴリーアーカイブ

Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models?

投稿日: 2024年9月27日作成者: jarxiv

要約多言語の大規模言語モデルは、さまざまな言語の話者に対応できるように設計され … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

UDC: A Unified Neural Divide-and-Conquer Framework for Large-Scale Combinatorial Optimization Problems

投稿日: 2024年9月27日作成者: jarxiv

要約シングルステージのニューラル組み合わせ最適化ソルバーは、専門知識を必要とせ … 続きを読む →

カテゴリー: cs.AI, cs.NE | コメントを受け付けていません

HydraViT: Stacking Heads for a Scalable ViT

投稿日: 2024年9月27日作成者: jarxiv

要約ビジョントランスフォーマー (ViT) のアーキテクチャ、特にマルチヘッ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Transferring disentangled representations: bridging the gap between synthetic and real images

投稿日: 2024年9月27日作成者: jarxiv

要約データ生成メカニズムの基本構造を分離する、意味のある効率的な表現を開発する … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning

投稿日: 2024年9月27日作成者: jarxiv

要約画像キャプションの最近の進歩により、画像とテキストのペアのデータの制限を克 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

投稿日: 2024年9月27日作成者: jarxiv

要約再訪問した場所を正確に認識することは、実体化したエージェントが位置を特定し … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.RO | コメントを受け付けていません

Visual Data Diagnosis and Debiasing with Concept Graphs

投稿日: 2024年9月27日作成者: jarxiv

要約今日の深層学習モデルの広範な成功は、サイズと複雑さが大幅に異なる広範なデー … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

投稿日: 2024年9月27日作成者: jarxiv

要約画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

投稿日: 2024年9月27日作成者: jarxiv

要約衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

投稿日: 2024年9月27日作成者: jarxiv

要約知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models?

UDC: A Unified Neural Divide-and-Conquer Framework for Large-Scale Combinatorial Optimization Problems

HydraViT: Stacking Heads for a Scalable ViT

Transferring disentangled representations: bridging the gap between synthetic and real images

IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

Visual Data Diagnosis and Debiasing with Concept Graphs

FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction

SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation

DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー