-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
SlotLifter: Slot-guided Feature Lifting for Learning Object-centric Radiance Fields
要約 複雑な視覚シーンからオブジェクト中心の抽象化を抽出する能力は、人間レベルの … 続きを読む
Exploring Domain Shift on Radar-Based 3D Object Detection Amidst Diverse Environmental Conditions
要約 ディープラーニングの急速な進化と自動運転システムとの統合により、マルチモー … 続きを読む
Dual-Space Knowledge Distillation for Large Language Models
要約 知識蒸留 (KD) は、大規模言語モデル (LLM) の知識をより小さなモ … 続きを読む
Clinical information extraction for Low-resource languages with Few-shot learning using Pre-trained language models and Prompting
要約 臨床文書からの医療情報の自動抽出には、必要な臨床専門知識にかかるコストの高 … 続きを読む
CEval: A Benchmark for Evaluating Counterfactual Text Generation
要約 反事実的なテキストの生成は、異なる分類方法でテキストを最小限に変更すること … 続きを読む
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) は、さまざまな単一イメージ … 続きを読む
Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of Text-To-Image Models
要約 DALL-E や StableDiffusion などの Text-To- … 続きを読む
Enhancing Visual Dialog State Tracking through Iterative Object-Entity Alignment in Multi-Round Conversations
要約 ビジュアル ダイアログ (VD) は、エージェントが複数ラウンドのダイアロ … 続きを読む
Large language models can consistently generate high-quality content for election disinformation operations
要約 大規模言語モデルの進歩により、選挙に関する説得力のある偽情報を大規模に生成 … 続きを読む
InterCLIP-MEP: Interactive CLIP and Memory-Enhanced Predictor for Multi-modal Sarcasm Detection
要約 テキストと画像の組み合わせを通じて伝えられるソーシャル メディアでの皮肉の … 続きを読む