-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning
要約 音声を大規模言語モデル (LLM) に統合し、その結果、命令追従/コンテキ … 続きを読む
Quantifying Variance in Evaluation Benchmarks
要約 評価ベンチマークは、大規模言語モデル (LLM) の機能を測定するための基 … 続きを読む
First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models
要約 マルチモーダル大規模言語モデル (MLLM) テクノロジーの開発により、そ … 続きを読む
Localizing Events in Videos with Multimodal Queries
要約 ビデオの理解はデジタル時代において極めて重要なタスクですが、ビデオの動的か … 続きを読む
SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding
要約 リモート センシング大型マルチモーダル モデル (RSLMM) は急速に開 … 続きを読む
Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy
要約 ディープ アンサンブルは、分類と分布外 (OOD) 検出において最先端の結 … 続きを読む
MeshAnything: Artist-Created Mesh Generation with Autoregressive Transformers
要約 最近では、再構築と生成によって作成された 3D アセットが手動で作成された … 続きを読む
A Simple Interpretable Transformer for Fine-Grained Image Classification and Analysis
要約 画像分類を解釈可能にするための Transformers の新しい使用法を … 続きを読む
Crafting Parts for Expressive Object Composition
要約 Stable Diffusion、DALLE-2 などの大規模な生成モデル … 続きを読む
SSTFB: Leveraging self-supervised pretext learning and temporal self-attention with feature branching for real-time video polyp segmentation
要約 ポリープは早期がんの指標であるため、ポリープの発生とその切除を評価すること … 続きを読む