-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
S$^{2}$FT: Efficient, Scalable and Generalizable LLM Fine-tuning by Structured Sparsity
要約 LLM の現在の PEFT メソッドは、高品質で効率的なトレーニング、また … 続きを読む
SoK: Watermarking for AI-Generated Content
要約 生成 AI (GenAI) 技術の出力の品質が向上するにつれて、人間が作成 … 続きを読む
Critical-Questions-of-Thought: Steering LLM reasoning with Argumentative Querying
要約 AI 研究における最近の画期的な急速な進歩にもかかわらず、最先端の大規模言 … 続きを読む
LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks
要約 このペーパーでは、現実世界のマルチタスクにわたる深い理解と推論を必要とする … 続きを読む
SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization
要約 線形層の量子化は広く使用されていますが、アテンションプロセスを加速するため … 続きを読む
G-VEval: A Versatile Metric for Evaluating Image and Video Captions Using GPT-4o
要約 視覚的なキャプションの評価指標は重要ですが、十分に検討されていません。 B … 続きを読む
Movie2Story: A framework for understanding videos and telling stories in the form of novel text
要約 マルチモーダルビデオからテキストへのモデルは、主にビデオコンテンツの簡単な … 続きを読む
GIRAFE: Glottal Imaging Dataset for Advanced Segmentation, Analysis, and Facilitative Playbacks Evaluation
要約 声帯の高速ビデオ内視鏡シーケンスから抽出された促進的再生の開発の進歩は … 続きを読む
A Full Transformer-based Framework for Automatic Pain Estimation using Videos
要約 痛みの自動推定は、信頼性の高い評価を提供し、患者の苦痛を軽減する最適な痛み … 続きを読む
Jet: A Modern Transformer-Based Normalizing Flow
要約 これまで、生成フローの正規化は、自然画像の生成モデルの有望なクラスとして浮 … 続きを読む