-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Enhancing Vision-Language Model Safety through Progressive Concept-Bottleneck-Driven Alignment
要約 大規模言語モデル (LLM) の強力な機能の恩恵を受けて、LLM に接続さ … 続きを読む
Real-Time Fitness Exercise Classification and Counting from Video Frames
要約 この論文では、双方向長短期記憶 (BiLSTM) ニューラル ネットワーク … 続きを読む
A Comprehensive Survey of Forgetting in Deep Learning Beyond Continual Learning
要約 忘却とは、以前に獲得した知識が失われたり劣化したりすることを指します。 忘 … 続きを読む
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion
要約 NOVIC は、自己回帰変換器を使用して分類ラベルを言語として生成的に出力 … 続きを読む
SP${ }^3$ : Superpixel-propagated pseudo-label learning for weakly semi-supervised medical image segmentation
要約 深層学習ベースの医療画像セグメンテーションは、診断を支援し、治療プロセスを … 続きを読む
Utilizing Large Language Models in an iterative paradigm with domain feedback for molecule optimization
要約 分子の最適化は、化学修飾を通じて特定の分子の望ましい特性を最適化する創薬に … 続きを読む
Dissecting Misalignment of Multimodal Large Language Models via Influence Function
要約 マルチモーダル大規模言語モデル (MLLM) は常に、位置がずれていたり、 … 続きを読む
MC-LLaVA: Multi-Concept Personalized Vision-Language Model
要約 現在のビジョン言語モデル (VLM) は、視覚的な質問応答を含むさまざまな … 続きを読む
PhD: A ChatGPT-Prompted Visual hallucination Evaluation Dataset
要約 マルチモーダル大規模言語モデル (MLLM) は幻覚を起こし、その結果、幻 … 続きを読む
WoodYOLO: A Novel Object Detector for Wood Species Detection in Microscopic Images
要約 木材種の識別は、木材製品の合法性の確保から環境保全活動の推進に至るまで、さ … 続きを読む