-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
MLLM-as-a-Judge: Assessing Multimodal LLM-as-a-Judge with Vision-Language Benchmark
要約 マルチモーダル大規模言語モデル (MLLM) は最近大きな注目を集めており … 続きを読む
Source-Free Domain Adaptation with Diffusion-Guided Source Data Generation
要約 このペーパーでは、ソースフリー ドメイン適応のための拡散モデル (DM-S … 続きを読む
Text or Image? What is More Important in Cross-Domain Generalization Capabilities of Hate Meme Detection Models?
要約 この論文は、マルチモーダルなヘイトミーム検出におけるクロスドメイン一般化と … 続きを読む
Detection and Pose Estimation of flat, Texture-less Industry Objects on HoloLens using synthetic Training
要約 現在の最先端の 6D 姿勢推定は、ますます多くの拡張現実アプリケーションに … 続きを読む
EfficientViT-SAM: Accelerated Segment Anything Model Without Performance Loss
要約 私たちは、加速されたセグメント何でもモデルの新しいファミリーである Eff … 続きを読む
VLN-Video: Utilizing Driving Videos for Outdoor Vision-and-Language Navigation
要約 屋外の視覚と言語のナビゲーション (VLN) では、エージェントが自然言語 … 続きを読む
Image captioning for Brazilian Portuguese using GRIT model
要約 この研究は、ブラジル系ポルトガル語の画像キャプションモデルの初期開発を示し … 続きを読む
Advancing Legal Reasoning: The Integration of AI to Navigate Complexities and Biases in Global Jurisprudence with Semi-Automated Arbitration Processes (SAAPs)
要約 この研究は、米国、英国、ルワンダ、スウェーデン、香港を含む 5 か国にわた … 続きを読む
High-dimensional and Permutation Invariant Anomaly Detection
要約 新しい物理プロセスの異常検出方法は、高次元の確率密度を学習することが難しい … 続きを読む
Can Generative Agents Predict Emotion?
要約 大規模言語モデル (LLM) は、人間に似た多くの能力を実証してきましたが … 続きを読む