「cs.AI」カテゴリーアーカイブ

Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification

投稿日: 2024年10月10日作成者: jarxiv

要約 Wildlife ReID には、視覚テクノロジーを利用してさまざまなシナ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Can Your Generative Model Detect Out-of-Distribution Covariate Shift?

投稿日: 2024年10月10日作成者: jarxiv

要約分布外 (OOD) の感覚データと共変量分布のシフトの検出は、キャプチャさ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

投稿日: 2024年10月10日作成者: jarxiv

要約この研究では、商業果樹園における緑色の果物の検出のために、YOLOv8、Y … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

VHELM: A Holistic Evaluation of Vision Language Models

投稿日: 2024年10月10日作成者: jarxiv

要約視覚言語モデル (VLM) を評価するための現在のベンチマークは、多くの場 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Thing2Reality: Transforming 2D Content into Conditioned Multiviews and 3D Gaussian Objects for XR Communication

投稿日: 2024年10月10日作成者: jarxiv

要約リモートコミュニケーション中、参加者は相互理解を高めるために、製品デザイン … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC | コメントを受け付けていません

InstructG2I: Synthesizing Images from Multimodal Attributed Graphs

投稿日: 2024年10月10日作成者: jarxiv

要約この論文では、見落とされているが重要なタスク Graph2Image、つま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.SI | コメントを受け付けていません

Do better language models have crisper vision?

投稿日: 2024年10月10日作成者: jarxiv

要約テキストのみの大規模言語モデル (LLM) は、視覚的な世界をどの程度理解 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

MM-Ego: Towards Building Egocentric Multimodal LLMs

投稿日: 2024年10月10日作成者: jarxiv

要約この研究は、自己中心的なビデオ理解のためのマルチモーダル基盤モデルの構築を … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models

投稿日: 2024年10月10日作成者: jarxiv

要約プロンプトは、人間が大規模言語モデル (LLM) と対話する主な方法として … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | コメントを受け付けていません

LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management

投稿日: 2024年10月10日作成者: jarxiv

要約大規模言語モデル (LLM) のコンテキストウィンドウの拡張により、さま … 続きを読む →

カテゴリー: C.4, cs.AI, cs.DC, cs.LG | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification

Can Your Generative Model Detect Out-of-Distribution Covariate Shift?

Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

VHELM: A Holistic Evaluation of Vision Language Models

Thing2Reality: Transforming 2D Content into Conditioned Multiviews and 3D Gaussian Objects for XR Communication

InstructG2I: Synthesizing Images from Multimodal Attributed Graphs

Do better language models have crisper vision?

MM-Ego: Towards Building Egocentric Multimodal LLMs

When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models

LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management

最近の投稿

最近のコメント

アーカイブ

カテゴリー