-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Development of Image Collection Method Using YOLO and Siamese Network
要約 ビッグデータの時代を迎える中、高品質なデータを収集することが非常に重要です … 続きを読む
Rethinking Visual Counterfactual Explanations Through Region Constraint
要約 視覚的反事実説明 (VCE) は、画像分類器の意思決定プロセスを明確にする … 続きを読む
Exploring Model Kinship for Merging Large Language Models
要約 モデルのマージは、大規模言語モデル (LLM) の機能と効率を強化するため … 続きを読む
Cascade learning in multi-task encoder-decoder networks for concurrent bone segmentation and glenohumeral joint assessment in shoulder CT scans
要約 変形性関節症は骨や軟骨に影響を及ぼす変性疾患であり、多くの場合、骨棘の形成 … 続きを読む
Cross-Modal Safety Mechanism Transfer in Large Vision-Language Models
要約 大規模視覚言語モデル (LVLM) における視覚言語の調整により、LLM … 続きを読む
Understanding Figurative Meaning through Explainable Visual Entailment
要約 大規模視覚言語モデル (VLM) は、視覚的な質問応答や視覚的な含意など、 … 続きを読む
Automatic Mapping of Anatomical Landmarks from Free-Text Using Large Language Models: Insights from Llama-2
要約 解剖学的ランドマークは、ナビゲーションや異常検出のための医療画像処理におい … 続きを読む
Embedding an Ethical Mind: Aligning Text-to-Image Synthesis via Lightweight Value Optimization
要約 大規模データでトレーニングされた拡散モデルの最近の進歩により、人間レベルの … 続きを読む
WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines
要約 ビジョン言語モデル (VLM) は、特に英語以外の言語や過小評価されている … 続きを読む
SAFREE: Training-Free and Adaptive Guard for Safe Text-to-Image And Video Generation
要約 拡散モデルの最近の進歩により、高品質の画像やビデオを生成する能力が大幅に向 … 続きを読む