-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
QuST-LLM: Integrating Large Language Models for Comprehensive Spatial Transcriptomics Analysis
要約 この論文では、大規模言語モデル (LLM) の機能を利用して空間トランスク … 続きを読む
On Layer-wise Representation Similarity: Application for Multi-Exit Models with a Single Classifier
要約 異なるモデル内および異なるモデル間の内部表現の類似性を分析することは、ディ … 続きを読む
Does Object Grounding Really Reduce Hallucination of Large Vision-Language Models?
要約 ラージ ビジョン ランゲージ モデル (LVLM) は、最近、画像キャプシ … 続きを読む
African or European Swallow? Benchmarking Large Vision-Language Models for Fine-Grained Object Classification
要約 最近のラージ ビジョン ランゲージ モデル (LVLM) は、数多くの画像 … 続きを読む
STimage-1K4M: A histopathology image-gene expression dataset for spatial transcriptomics
要約 マルチモーダル アルゴリズムの最近の進歩は、大規模な画像テキスト データセ … 続きを読む
Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs
要約 ビジョン言語モデル (VLM) は、強力な知覚能力と推論能力を必要とする、 … 続きを読む
Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities
要約 視覚的思考を伴う質問が提示されると、人間は自然に推論方法を切り替え、しばし … 続きを読む
Transformers Can Represent $n$-gram Language Models
要約 既存の研究では、計算の形式的なモデルを使用して、変圧器アーキテクチャの表現 … 続きを読む
Informatics & dairy industry coalition: AI trends and present challenges
要約 人工知能 (AI) は、生産プロセスを強化し、手作業の繰り返し作業を最小限 … 続きを読む
Rationale-based Ensemble of Multiple QA Strategies for Zero-shot Knowledge-based VQA
要約 知識ベースの視覚的質問回答 (K-VQA) では、画像に描かれている内容を … 続きを読む
カテゴリー: cs.CL
Rationale-based Ensemble of Multiple QA Strategies for Zero-shot Knowledge-based VQA はコメントを受け付けていません