「cs.AI」カテゴリーアーカイブ

Fwd2Bot: LVLM Visual Token Compression with Double Forward Bottleneck

投稿日: 2025年3月28日作成者: jarxiv

要約この作業では、大規模なビジョン言語モデル（LVLM）のビジョントークンを、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Uni4D: Unifying Visual Foundation Models for 4D Modeling from a Single Video

投稿日: 2025年3月28日作成者: jarxiv

要約このペーパーでは、カジュアルなビデオの動的なシーンを理解するための統一され … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Stable-SCore: A Stable Registration-based Framework for 3D Shape Correspondence

投稿日: 2025年3月28日作成者: jarxiv

要約キャラクターの形状の対応を確立することは、コンピュータービジョンとグラフィ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

StyleMotif: Multi-Modal Motion Stylization using Style-Content Cross Fusion

投稿日: 2025年3月28日作成者: jarxiv

要約新しい様式化された運動潜在拡散モデルであるStylemotifを提示し、複 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Flip Learning: Weakly Supervised Erase to Segment Nodules in Breast Ultrasound

投稿日: 2025年3月28日作成者: jarxiv

要約 2D乳房超音波（BUS）と3D自動乳房超音波（ABUS）の両方における結節 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

LaMOuR: Leveraging Language Models for Out-of-Distribution Recovery in Reinforcement Learning

投稿日: 2025年3月28日作成者: jarxiv

要約 Deep Renection Learning（DRL）は、ロボット制御に … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Reason-RFT: Reinforcement Fine-Tuning for Visual Reasoning

投稿日: 2025年3月28日作成者: jarxiv

要約視覚的推論能力は、複雑なマルチモーダルデータを理解する上で重要な役割を果た … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Direct Post-Training Preference Alignment for Multi-Agent Motion Generation Models Using Implicit Feedback from Pre-training Demonstrations

投稿日: 2025年3月27日作成者: jarxiv

要約 LLMの最近の進歩は、具体化されたアプリケーションでモーション生成モデルに … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

TwoStep: Multi-agent Task Planning using Classical Planners and Large Language Models

投稿日: 2025年3月27日作成者: jarxiv

要約計画ドメイン定義言語（PDDL）などの古典的な計画の定式化が可能な場合は、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MA, cs.RO | コメントを受け付けていません

Inference-Time Policy Steering through Human Interactions

投稿日: 2025年3月27日作成者: jarxiv

要約人間のデモンストレーションで訓練された生成ポリシーは、マルチモーダルで長老 … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Fwd2Bot: LVLM Visual Token Compression with Double Forward Bottleneck

Uni4D: Unifying Visual Foundation Models for 4D Modeling from a Single Video

Stable-SCore: A Stable Registration-based Framework for 3D Shape Correspondence

StyleMotif: Multi-Modal Motion Stylization using Style-Content Cross Fusion

Flip Learning: Weakly Supervised Erase to Segment Nodules in Breast Ultrasound

LaMOuR: Leveraging Language Models for Out-of-Distribution Recovery in Reinforcement Learning

Reason-RFT: Reinforcement Fine-Tuning for Visual Reasoning

Direct Post-Training Preference Alignment for Multi-Agent Motion Generation Models Using Implicit Feedback from Pre-training Demonstrations

TwoStep: Multi-agent Task Planning using Classical Planners and Large Language Models

Inference-Time Policy Steering through Human Interactions

最近の投稿

最近のコメント

アーカイブ

カテゴリー