-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Evaluating the Correctness of Inference Patterns Used by LLMs for Judgment
要約 このホワイトペーパーでは、人間のドメインの知識に従って、LLMの潜在的な誤 … 続きを読む
Automatic Synthetic Data and Fine-grained Adaptive Feature Alignment for Composed Person Retrieval
要約 人の検索は注目の高まりを引き付けました。 既存の方法は、主に2つの検索モー … 続きを読む
KERL: Knowledge-Enhanced Personalized Recipe Recommendation using Large Language Models
要約 大規模な言語モデル(LLMS)の最近の進歩と食品データの豊富さにより、LL … 続きを読む
How Effective Can Dropout Be in Multiple Instance Learning ?
要約 複数のインスタンス学習(MIL)は、さまざまなアプリケーションに人気のある … 続きを読む
CAD-Coder: An Open-Source Vision-Language Model for Computer-Aided Design Code Generation
要約 正確で編集可能な3D CADモデルの効率的な作成は、エンジニアリング設計に … 続きを読む
Beyond Words: Multimodal LLM Knows When to Speak
要約 大規模な言語モデル(LLM)ベースのチャットボットは、コヒーレントでコンテ … 続きを読む
EmoGist: Efficient In-Context Learning for Visual Emotion Understanding
要約 この論文では、LVLMSを使用して視覚的な感情分類を実行するためのトレーニ … 続きを読む
AKRMap: Adaptive Kernel Regression for Trustworthy Visualization of Cross-Modal Embeddings
要約 クロスモーダル埋め込みは、マルチモーダルモデルの基礎を形成します。 ただし … 続きを読む
Training-Free Watermarking for Autoregressive Image Generation
要約 目に見えない画像の透かしは、画像の所有権を保護し、視覚生成モデルの悪意のあ … 続きを読む
Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training
要約 大規模な推論モデル(LRM)内の専門家の混合(MOE)アーキテクチャは、専 … 続きを読む