月別アーカイブ: 2024年8月

Contrastive Learning for Image Complexity Representation

投稿日: 2024年8月7日作成者: jarxiv

要約画像の複雑さを定量化して評価することは、さまざまなコンピュータービジョン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion

投稿日: 2024年8月7日作成者: jarxiv

要約この論文は、視覚を通じて完全な物体の形状を認識するという課題に取り組みます … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation

投稿日: 2024年8月7日作成者: jarxiv

要約複雑な人間活動認識 (CHAR) は、ユビキタスコンピューティング、特に … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, eess.SP | コメントを受け付けていません

GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation

投稿日: 2024年8月7日作成者: jarxiv

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Evaluating Neural Radiance Fields (NeRFs) for 3D Plant Geometry Reconstruction in Field Conditions

投稿日: 2024年8月7日作成者: jarxiv

要約私たちは、屋内環境から屋外フィールドまで、さまざまな環境で植物を 3D 再 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

CR3DT: Camera-RADAR Fusion for 3D Detection and Tracking

投稿日: 2024年8月7日作成者: jarxiv

要約自動運転車を可能にするためには、周囲の物体の正確な検出と追跡が不可欠です。 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

AMES: Asymmetric and Memory-Efficient Similarity Estimation for Instance-level Retrieval

投稿日: 2024年8月7日作成者: jarxiv

要約この研究では、メモリ効率の制約を伴うインスタンスレベルの画像取得の再ラン … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer

投稿日: 2024年8月7日作成者: jarxiv

要約特定のオーディオを使用してビデオをリップシンクすることは、仮想プレゼンター … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.MM | コメントを受け付けていません

Biomedical SAM 2: Segment Anything in Biomedical Images and Videos

投稿日: 2024年8月7日作成者: jarxiv

要約医用画像のセグメンテーションとビデオオブジェクトのセグメンテーションは、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GenAI Arena: An Open Evaluation Platform for Generative Models

投稿日: 2024年8月7日作成者: jarxiv

要約生成 AI は、画像やビデオの生成などの分野に革命を起こすために目覚ましい … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年8月

Contrastive Learning for Image Complexity Representation

LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion

VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation

GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation

Evaluating Neural Radiance Fields (NeRFs) for 3D Plant Geometry Reconstruction in Field Conditions

CR3DT: Camera-RADAR Fusion for 3D Detection and Tracking

AMES: Asymmetric and Memory-Efficient Similarity Estimation for Instance-level Retrieval

ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer

Biomedical SAM 2: Segment Anything in Biomedical Images and Videos

GenAI Arena: An Open Evaluation Platform for Generative Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー