-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Modeling cognitive processes of natural reading with transformer-based Language Models
要約 自然言語処理(NLP)の最近の進歩により、テキスト生成のために非常に洗練さ … 続きを読む
Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization
要約 犬の樹皮を聞いて、駐車した車を見るためだけに音に向かって曲がると想像してく … 続きを読む
Equal is Not Always Fair: A New Perspective on Hyperspectral Representation Non-Uniformity
要約 ハイパースペクトル画像(HSI)表現は、スペクトル依存性、空間連続性、およ … 続きを読む
Communication-Efficient Federated Learning Based on Explanation-Guided Pruning for Remote Sensing Image Classification
要約 Federated Learning(FL)は、クライアントのローカルデー … 続きを読む
Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models
要約 ビジョン言語モデル(VLM)は、画像キャプションやビデオ質問の回答などのオ … 続きを読む
Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?
要約 検証可能な報酬(RLVR)による強化学習は最近、特に数学とプログラミングタ … 続きを読む
Patho-R1: A Multimodal Reinforcement Learning-Based Pathology Expert Reasoner
要約 ビジョン言語モデル(VLM)の最近の進歩により、一般的な医療分野での広範な … 続きを読む
Visual Planning: Let’s Think Only with Images
要約 大規模な言語モデル(LLMS)とそのマルチモーダル拡張(MLLM)の最近の … 続きを読む
Improving Object Detection Performance through YOLOv8: A Comprehensive Training and Evaluation Study
要約 本研究では、YOLOv8ベースのセグメンテーションモデルによる顔画像のしわ … 続きを読む
SurgPose: Generalisable Surgical Instrument Pose Estimation using Zero-Shot Learning and Stereo Vision
要約 ロボット支援低侵襲手術(RMIS)における外科的ツールの正確なポーズ推定は … 続きを読む