-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
PARAMANU-GANITA: Language Model with Mathematical Capabilities
要約 この論文では、数学に基づいた 2 億 800 万パラメータの新しい自動回帰 … 続きを読む
A Unified Framework for Model Editing
要約 私たちは、2 つの主要な「検索して編集」モデル編集手法である ROME と … 続きを読む
SpaceByte: Towards Deleting Tokenization from Large Language Modeling
要約 トークン化はパフォーマンスを大幅に向上させるため、大規模な言語モデルで広く … 続きを読む
BCFPL: Binary classification ConvNet based Fast Parking space recognition with Low resolution image
要約 自動車は人類の経済活動、特に大都市において重要な役割を果たしています。 こ … 続きを読む
YOLOOC: YOLO-based Open-Class Incremental Object Detection with Novel Class Discovery
要約 オープンワールド物体検出 (OWOD) は実際に使用されているため、最近大 … 続きを読む
Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback
要約 急速に開発されているラージ ビジョン言語モデル (LVLM) は、さまざま … 続きを読む
Robustness and Visual Explanation for Black Box Image, Video, and ECG Signal Classification with Reinforcement Learning
要約 ECG 信号分析 (1D)、画像分類 (2D)、ビデオ分類 (3D) に及 … 続きを読む
UrbanCross: Enhancing Satellite Image-Text Retrieval with Cross-Domain Adaptation
要約 都市化の課題は、都市アプリケーション向けの地理的セマンティクスが強化された … 続きを読む
Automatic Discovery of Visual Circuits
要約 これまで、人間が解釈可能な計算を深視力モデルに実装するネットワーク サブコ … 続きを読む
Graphic Design with Large Multimodal Model
要約 グラフィック デザインの分野では、デザイン要素を統合した一体性のある多層ア … 続きを読む