「cs.AI」カテゴリーアーカイブ

Understanding Figurative Meaning through Explainable Visual Entailment

投稿日: 2025年2月18日作成者: jarxiv

要約大規模なビジョン言語モデル（VLM）は、視覚的な質問や視覚的誘惑など、画像 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Generation and Detection of Sign Language Deepfakes – A Linguistic and Visual Analysis

投稿日: 2025年2月18日作成者: jarxiv

要約この研究では、上半身世代、特に聴覚障害者とハードの聴覚（DHOH）コミュニ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Both Text and Images Leaked! A Systematic Analysis of Multimodal LLM Data Contamination

投稿日: 2025年2月18日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLMS）の急速な進行により、さまざまなマ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

PRISM: Self-Pruning Intrinsic Selection Method for Training-Free Multimodal Data Selection

投稿日: 2025年2月18日作成者: jarxiv

要約ビジュアルインストラクションチューニングにより、事前に訓練されたマルチモー … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Diffusion Models without Classifier-free Guidance

投稿日: 2025年2月18日作成者: jarxiv

要約このホワイトペーパーでは、一般的に使用される分類器のないガイダンス（CFG … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

S$^2$-Diffusion: Generalizing from Instance-level to Category-level Skills in Robot Manipulation

投稿日: 2025年2月18日作成者: jarxiv

要約スキル学習の最近の進歩により、ロボット操作は、実際の数のデモンストレーショ … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Graph Foundation Models for Recommendation: A Comprehensive Survey

投稿日: 2025年2月18日作成者: jarxiv

要約推奨システム（RS）は、オンライン情報の広大な広がりをナビゲートするための … 続きを読む →

カテゴリー: cs.AI, cs.IR, cs.LG | コメントを受け付けていません

Vote-Tree-Planner: Optimizing Execution Order in LLM-based Task Planning Pipeline via Voting

投稿日: 2025年2月17日作成者: jarxiv

要約大規模な言語モデル（LLMS）を閉ループロボットタスク計画に統合することは … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Adaptive Teaming in Multi-Drone Pursuit: Simulation, Training, and Deployment

投稿日: 2025年2月17日作成者: jarxiv

要約適応的なチームは、事前の調整なしに目に見えないチームメイトと協力する能力で … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Efficient Evaluation of Multi-Task Robot Policies With Active Experiment Selection

投稿日: 2025年2月17日作成者: jarxiv

要約学習したロボット制御ポリシーを評価して、物理的なタスクレベルの機能を決定す … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Understanding Figurative Meaning through Explainable Visual Entailment

Generation and Detection of Sign Language Deepfakes – A Linguistic and Visual Analysis

Both Text and Images Leaked! A Systematic Analysis of Multimodal LLM Data Contamination

PRISM: Self-Pruning Intrinsic Selection Method for Training-Free Multimodal Data Selection

Diffusion Models without Classifier-free Guidance

S$^2$-Diffusion: Generalizing from Instance-level to Category-level Skills in Robot Manipulation

Graph Foundation Models for Recommendation: A Comprehensive Survey

Vote-Tree-Planner: Optimizing Execution Order in LLM-based Task Planning Pipeline via Voting

Adaptive Teaming in Multi-Drone Pursuit: Simulation, Training, and Deployment

Efficient Evaluation of Multi-Task Robot Policies With Active Experiment Selection

最近の投稿

最近のコメント

アーカイブ

カテゴリー