cs.AI」カテゴリーアーカイブ

Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification

要約 Wildlife ReID には、視覚テクノロジーを利用してさまざまなシナ … 続きを読む

カテゴリー: cs.AI, cs.CV | Adaptive High-Frequency Transformer for Diverse Wildlife Re-Identification はコメントを受け付けていません

Can Your Generative Model Detect Out-of-Distribution Covariate Shift?

要約 分布外 (OOD) の感覚データと共変量分布のシフトの検出は、キャプチャさ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Can Your Generative Model Detect Out-of-Distribution Covariate Shift? はコメントを受け付けていません

Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

要約 この研究では、商業果樹園における緑色の果物の検出のために、YOLOv8、Y … 続きを読む

カテゴリー: cs.AI, cs.CV | Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments はコメントを受け付けていません

VHELM: A Holistic Evaluation of Vision Language Models

要約 視覚言語モデル (VLM) を評価するための現在のベンチマークは、多くの場 … 続きを読む

カテゴリー: cs.AI, cs.CV | VHELM: A Holistic Evaluation of Vision Language Models はコメントを受け付けていません

Thing2Reality: Transforming 2D Content into Conditioned Multiviews and 3D Gaussian Objects for XR Communication

要約 リモートコミュニケーション中、参加者は相互理解を高めるために、製品デザイン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC | Thing2Reality: Transforming 2D Content into Conditioned Multiviews and 3D Gaussian Objects for XR Communication はコメントを受け付けていません

InstructG2I: Synthesizing Images from Multimodal Attributed Graphs

要約 この論文では、見落とされているが重要なタスク Graph2Image、つま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.SI | InstructG2I: Synthesizing Images from Multimodal Attributed Graphs はコメントを受け付けていません

Do better language models have crisper vision?

要約 テキストのみの大規模言語モデル (LLM) は、視覚的な世界をどの程度理解 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Do better language models have crisper vision? はコメントを受け付けていません

MM-Ego: Towards Building Egocentric Multimodal LLMs

要約 この研究は、自己中心的なビデオ理解のためのマルチモーダル基盤モデルの構築を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MM-Ego: Towards Building Egocentric Multimodal LLMs はコメントを受け付けていません

When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models

要約 プロンプトは、人間が大規模言語モデル (LLM) と対話する主な方法として … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.HC, cs.LG | When ‘A Helpful Assistant’ Is Not Really Helpful: Personas in System Prompts Do Not Improve Performances of Large Language Models はコメントを受け付けていません

LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management

要約 大規模言語モデル (LLM) のコンテキスト ウィンドウの拡張により、さま … 続きを読む

カテゴリー: C.4, cs.AI, cs.DC, cs.LG | LayerKV: Optimizing Large Language Model Serving with Layer-wise KV Cache Management はコメントを受け付けていません