月別アーカイブ: 2024年8月

AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation

要約 大規模言語モデル(Large Language Model: LLM)ベー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation はコメントを受け付けていません

SegStitch: Multidimensional Transformer for Robust and Efficient Medical Imaging Segmentation

要約 医用画像のセグメンテーションは、病変の自動認識と解析において重要な役割を果 … 続きを読む

カテゴリー: cs.CV | SegStitch: Multidimensional Transformer for Robust and Efficient Medical Imaging Segmentation はコメントを受け付けていません

How Effective are Self-Supervised Models for Contact Identification in Videos

要約 自己教師あり学習(Self-Supervised Learning:SSL … 続きを読む

カテゴリー: cs.CV | How Effective are Self-Supervised Models for Contact Identification in Videos はコメントを受け付けていません

High-Quality, ROS Compatible Video Encoding and Decoding for High-Definition Datasets

要約 ロボットのデータセットは、科学的ベンチマークや、SLAM(Simultan … 続きを読む

カテゴリー: cs.CV, cs.RO | High-Quality, ROS Compatible Video Encoding and Decoding for High-Definition Datasets はコメントを受け付けていません

Mitigating Multilingual Hallucination in Large Vision-Language Models

要約 大規模視覚言語モデル(Large Vision-Language Mode … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Mitigating Multilingual Hallucination in Large Vision-Language Models はコメントを受け付けていません

Alleviating Hallucination in Large Vision-Language Models with Active Retrieval Augmentation

要約 近年、大規模言語モデル(LLM)において、外部の知識資源から情報を検索する … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Alleviating Hallucination in Large Vision-Language Models with Active Retrieval Augmentation はコメントを受け付けていません

MUFASA: Multi-View Fusion and Adaptation Network with Spatial Awareness for Radar Object Detection

要約 近年、レーダーによる物体検出に基づくアプローチは、LiDARと比較して悪天 … 続きを読む

カテゴリー: cs.CV | MUFASA: Multi-View Fusion and Adaptation Network with Spatial Awareness for Radar Object Detection はコメントを受け付けていません

Learned Compression of Point Cloud Geometry and Attributes in a Single Model through Multimodal Rate-Control

要約 点群圧縮は、必要なストリーミングデータレートを大幅に削減するため、ボリュー … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | Learned Compression of Point Cloud Geometry and Attributes in a Single Model through Multimodal Rate-Control はコメントを受け付けていません

Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection

要約 教師なし3D物体検出は、LiDARポイントのようなラベル付けされていない生 … 続きを読む

カテゴリー: cs.CV | Harnessing Uncertainty-aware Bounding Boxes for Unsupervised 3D Object Detection はコメントを受け付けていません

Are Bigger Encoders Always Better in Vision Large Models?

要約 近年、マルチモーダル大規模言語モデル(MLLM)は、実世界での応用において … 続きを読む

カテゴリー: cs.CL, cs.CV | Are Bigger Encoders Always Better in Vision Large Models? はコメントを受け付けていません