「cs.AI」カテゴリーアーカイブ

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

投稿日: 2025年1月24日作成者: jarxiv

要約グラフィカルユーザーインターフェイス (GUI) アクションのグラウン … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection

投稿日: 2025年1月24日作成者: jarxiv

要約指向性物体検出 (OOD) に対する需要の高まりに伴い、点教師あり OOD … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Improving Video Generation with Human Feedback

投稿日: 2025年1月24日作成者: jarxiv

要約ビデオ生成は、修正されたフロー技術によって大幅な進歩を遂げましたが、スムー … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Truncated Consistency Models

投稿日: 2025年1月24日作成者: jarxiv

要約一貫性モデルが最近導入され、初期ノイズからの確率フローオード（PF ODE … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Temporal Preference Optimization for Long-Form Video Understanding

投稿日: 2025年1月24日作成者: jarxiv

要約ビデオの大規模なマルチモーダルモデル（ビデオLMMS）の大幅な進歩にもかか … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization

投稿日: 2025年1月24日作成者: jarxiv

要約テスト時間適応（TTA）は、トレーニングとテストデータの間の分布シフトに対 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Can We Generate Images with CoT? Let’s Verify and Reinforce Image Generation Step by Step

投稿日: 2025年1月24日作成者: jarxiv

要約思考連鎖 (CoT) 推論は、複雑な理解タスクに取り組むために、大規模なモ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

CRPO: Confidence-Reward Driven Preference Optimization for Machine Translation

投稿日: 2025年1月24日作成者: jarxiv

要約大規模言語モデル (LLM) は、自然言語処理タスクにおいて大きな可能性を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

投稿日: 2025年1月24日作成者: jarxiv

要約マルチビュー3D再構成は、特に多様な視点で正確でスケーラブルな表現を必要と … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.RO | コメントを受け付けていません

Guaranteed Recovery of Unambiguous Clusters

投稿日: 2025年1月24日作成者: jarxiv

要約クラスタリングは、「正しい」クラスタリングがどうあるべきかという本質的なあ … 続きを読む →

カテゴリー: cs.AI, cs.DS, cs.IT, cs.LG, math.IT, math.ST, stat.TH | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection

Improving Video Generation with Human Feedback

Truncated Consistency Models

Temporal Preference Optimization for Long-Form Video Understanding

Towards Robust Multimodal Open-set Test-time Adaptation via Adaptive Entropy-aware Optimization

Can We Generate Images with CoT? Let’s Verify and Reinforce Image Generation Step by Step

CRPO: Confidence-Reward Driven Preference Optimization for Machine Translation

Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

Guaranteed Recovery of Unambiguous Clusters

最近の投稿

最近のコメント

アーカイブ

カテゴリー