投稿者「jarxiv」のアーカイブ

Detecting and Understanding Hateful Contents in Memes Through Captioning and Visual Question-Answering

投稿日: 2025年4月24日作成者: jarxiv

要約ミームはユーモアや文化的な解説に広く使用されていますが、憎悪なコンテンツを … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

V$^2$R-Bench: Holistically Evaluating LVLM Robustness to Fundamental Visual Variations

投稿日: 2025年4月24日作成者: jarxiv

要約大規模なビジョン言語モデル（LVLMS）は、さまざまなビジョン言語タスクに … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Prompt-Tuning SAM: From Generalist to Specialist with only 2048 Parameters and 16 Training Images

投稿日: 2025年4月24日作成者: jarxiv

要約 Segment Anyny Anything Model（SAM）は、ポイ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Gaussian Splatting is an Effective Data Generator for 3D Object Detection

投稿日: 2025年4月24日作成者: jarxiv

要約自律運転における3Dオブジェクト検出のデータ増強を調査します。私たちは、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MMMORRF: Multimodal Multilingual Modularized Reciprocal Rank Fusion

投稿日: 2025年4月24日作成者: jarxiv

要約ビデオには、視覚イベント、テキストオーバーレイ、サウンド、音声など、複数の … 続きを読む →

カテゴリー: cs.CV, cs.IR | コメントを受け付けていません

AudioX: Diffusion Transformer for Anything-to-Audio Generation

投稿日: 2025年4月24日作成者: jarxiv

要約オーディオと音楽の生成は、多くのアプリケーションで重要なタスクとして浮上し … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Frequency-Compensated Network for Daily Arctic Sea Ice Concentration Prediction

投稿日: 2025年4月24日作成者: jarxiv

要約北極圏の海氷濃度（原文）を正確に予測することは、世界の生態系の健康と航海の … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Feature Mixing Approach for Detecting Intraoperative Adverse Events in Laparoscopic Roux-en-Y Gastric Bypass Surgery

投稿日: 2025年4月24日作成者: jarxiv

要約出血や熱損傷などの術中の有害事象（IAE）は、検出されない場合、重度の術後 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras

投稿日: 2025年4月24日作成者: jarxiv

要約 HyperComplex画像処理は、代数および幾何学的原理を含む統一された … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Tri-FusionNet: Enhancing Image Description Generation with Transformer-based Fusion Network and Dual Attention Mechanism

投稿日: 2025年4月24日作成者: jarxiv

要約画像の説明の生成は、視覚コンテンツのアクセシビリティとAIの理解に不可欠で … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

Detecting and Understanding Hateful Contents in Memes Through Captioning and Visual Question-Answering

V$^2$R-Bench: Holistically Evaluating LVLM Robustness to Fundamental Visual Variations

Prompt-Tuning SAM: From Generalist to Specialist with only 2048 Parameters and 16 Training Images

Gaussian Splatting is an Effective Data Generator for 3D Object Detection

MMMORRF: Multimodal Multilingual Modularized Reciprocal Rank Fusion

AudioX: Diffusion Transformer for Anything-to-Audio Generation

Frequency-Compensated Network for Daily Arctic Sea Ice Concentration Prediction

Feature Mixing Approach for Detecting Intraoperative Adverse Events in Laparoscopic Roux-en-Y Gastric Bypass Surgery

Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras

Tri-FusionNet: Enhancing Image Description Generation with Transformer-based Fusion Network and Dual Attention Mechanism

最近の投稿

最近のコメント

アーカイブ

カテゴリー