-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
PhyX: Does Your Model Have the ‘Wits’ for Physical Reasoning?
要約 既存のベンチマークは、インテリジェンスの重要な側面をキャプチャできません。 … 続きを読む
カテゴリー: cs.AI
PhyX: Does Your Model Have the ‘Wits’ for Physical Reasoning? はコメントを受け付けていません
DeepTheorem: Advancing LLM Reasoning for Theorem Proving Through Natural Language and Reinforcement Learning
要約 定理証明は、大規模な言語モデル(LLM)の複雑な推論能力を評価するための主 … 続きを読む
Differential Information: An Information-Theoretic Perspective on Preference Optimization
要約 直接選好最適化(DPO)は、監督された方法で人間の好みを整合するための標準 … 続きを読む
From Chat Logs to Collective Insights: Aggregative Question Answering
要約 大規模な言語モデル(LLM)を搭載した会話エージェントは、私たちの毎日の相 … 続きを読む
One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory
要約 効果的なビデオトークン化は、長いビデオのトランスモデルをスケーリングするた … 続きを読む
Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging
要約 医療画像分析では、機能エンジニアリングは、機械学習モデルの設計とパフォーマ … 続きを読む
VF-Eval: Evaluating Multimodal LLMs for Generating Feedback on AIGC Videos
要約 MLLMSは、最近のビデオ質問のために広く研究されています。 ただし、既存 … 続きを読む
CLDTracker: A Comprehensive Language Description for Visual Tracking
要約 投票は、動的な外観の変化、閉塞、および背景乱れにより、コンピュータービジョ … 続きを読む
Skin Lesion Phenotyping via Nested Multi-modal Contrastive Learning
要約 画像とメタデータの間の複雑な関係を捉える新しいネストされたコントラスト学習 … 続きを読む
MAGREF: Masked Guidance for Any-Reference Video Generation
要約 ビデオ生成は、深い生成モデル、特に拡散ベースのアプローチの出現に大きな進歩 … 続きを読む