-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
MantisScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation
要約 近年、ビデオ生成において大きな進歩が見られます。 ただし、自動ビデオ指標の … 続きを読む
AGLA: Mitigating Object Hallucinations in Large Vision-Language Models with Assembly of Global and Local Attention
要約 大規模視覚言語モデル (LVLM) は、さまざまなマルチモーダル タスクで … 続きを読む
An End-to-End, Segmentation-Free, Arabic Handwritten Recognition Model on KHATT
要約 特徴抽出に DCNN を活用し、シーケンス認識に双方向長短期記憶 (BLS … 続きを読む
Multimodal Task Vectors Enable Many-Shot Multimodal In-Context Learning
要約 少数ショット学習におけるインターリーブ大規模マルチモーダル モデル (LM … 続きを読む
Image Conductor: Precision Control for Interactive Video Synthesis
要約 映画制作やアニメーション制作では、多くの場合、カメラのトランジションやオブ … 続きを読む
NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking
要約 ビジョンに基づいた運転政策のベンチマークは困難です。 一方で、実際のデータ … 続きを読む
FVEL: Interactive Formal Verification Environment with Large Language Models via Theorem Proving
要約 形式検証 (FV) は、進化する大規模言語モデル (LLM) による現在の … 続きを読む
Graph Neural Networks in Histopathology: Emerging Trends and Future Directions
要約 全スライド画像 (WSI) の組織病理学的分析では、深層学習手法、特に畳み … 続きを読む
Fairness Concerns in App Reviews: A Study on AI-based Mobile Apps
要約 公平性は、AI ベースのシステムで対処する必要がある社会技術的な懸念事項の … 続きを読む
Joint Demonstration and Preference Learning Improves Policy Alignment with Human Feedback
要約 人間の好みと価値観を一致させることは、現代の基盤モデルと具体化された AI … 続きを読む