月別アーカイブ: 2024年8月

Contrastive Learning for Image Complexity Representation

要約 画像の複雑さを定量化して評価することは、さまざまなコンピューター ビジョン … 続きを読む

カテゴリー: cs.CV | Contrastive Learning for Image Complexity Representation はコメントを受け付けていません

LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion

要約 この論文は、視覚を通じて完全な物体の形状を認識するという課題に取り組みます … 続きを読む

カテゴリー: cs.CV, cs.RO | LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion はコメントを受け付けていません

VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation

要約 複雑な人間活動認識 (CHAR) は、ユビキタス コンピューティング、特に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, eess.SP | VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation はコメントを受け付けていません

GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation はコメントを受け付けていません

Evaluating Neural Radiance Fields (NeRFs) for 3D Plant Geometry Reconstruction in Field Conditions

要約 私たちは、屋内環境から屋外フィールドまで、さまざまな環境で植物を 3D 再 … 続きを読む

カテゴリー: cs.CV | Evaluating Neural Radiance Fields (NeRFs) for 3D Plant Geometry Reconstruction in Field Conditions はコメントを受け付けていません

CR3DT: Camera-RADAR Fusion for 3D Detection and Tracking

要約 自動運転車を可能にするためには、周囲の物体の正確な検出と追跡が不可欠です。 … 続きを読む

カテゴリー: cs.AI, cs.CV | CR3DT: Camera-RADAR Fusion for 3D Detection and Tracking はコメントを受け付けていません

AMES: Asymmetric and Memory-Efficient Similarity Estimation for Instance-level Retrieval

要約 この研究では、メモリ効率の制約を伴うインスタンス レベルの画像取得の再ラン … 続きを読む

カテゴリー: cs.CV | AMES: Asymmetric and Memory-Efficient Similarity Estimation for Instance-level Retrieval はコメントを受け付けていません

ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer

要約 特定のオーディオを使用してビデオをリップシンクすることは、仮想プレゼンター … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.MM | ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer はコメントを受け付けていません

Biomedical SAM 2: Segment Anything in Biomedical Images and Videos

要約 医用画像のセグメンテーションとビデオ オブジェクトのセグメンテーションは、 … 続きを読む

カテゴリー: cs.CV | Biomedical SAM 2: Segment Anything in Biomedical Images and Videos はコメントを受け付けていません

GenAI Arena: An Open Evaluation Platform for Generative Models

要約 生成 AI は、画像やビデオの生成などの分野に革命を起こすために目覚ましい … 続きを読む

カテゴリー: cs.AI, cs.CV | GenAI Arena: An Open Evaluation Platform for Generative Models はコメントを受け付けていません