「cs.CV」カテゴリーアーカイブ

Leveraging multimodal explanatory annotations for video interpretation with Modality Specific Dataset

投稿日: 2025年4月16日作成者: jarxiv

要約人間が注目した説明概念を含むデータセットであるMobygazeを使用して、 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Next-Future: Sample-Efficient Policy Learning for Robotic-Arm Tasks

投稿日: 2025年4月16日作成者: jarxiv

要約 Hindsight Experience Replay（彼女）は、バイナリ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Cryo-em images are intrinsically low dimensional

投稿日: 2025年4月16日作成者: jarxiv

要約シミュレーションベースの推論は、クレオスビなどの方法でニューラルネットワー … 続きを読む →

カテゴリー: cs.CV, cs.LG, q-bio.BM, q-bio.QM, stat.ML | コメントを受け付けていません

UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis

投稿日: 2025年4月16日作成者: jarxiv

要約大規模なビジョン言語モデルの最近の進歩は、デジタルデバイスの生産性を高める … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.HC | コメントを受け付けていません

Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach

投稿日: 2025年4月16日作成者: jarxiv

要約情報技術の急速な発展に伴い、近代的な戦争はますます知性に依存しており、軍事 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Single-Input Multi-Output Model Merging: Leveraging Foundation Models for Dense Multi-Task Learning

投稿日: 2025年4月16日作成者: jarxiv

要約モデルのマージは、シングルタスクチェックポイントをマルチタスクモデルに融合 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution

投稿日: 2025年4月16日作成者: jarxiv

要約畳み込みニューラルネットワーク（CNNS）は、効率的な画像超解像度で広く使 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Efficient Medical Image Restoration via Reliability Guided Learning in Frequency Domain

投稿日: 2025年4月16日作成者: jarxiv

要約医療画像の修復タスクは、低用量のCT画像除去、MRI超解像度、MRIアーテ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack

投稿日: 2025年4月16日作成者: jarxiv

要約敏感な環境に展開された深いニューラルネットワークベースのシステムは、敵対的 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

UniAnimate-DiT: Human Image Animation with Large-Scale Video Diffusion Transformer

投稿日: 2025年4月16日作成者: jarxiv

要約このレポートでは、一貫した人間のイメージアニメーションのためのオープンソー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Leveraging multimodal explanatory annotations for video interpretation with Modality Specific Dataset

Next-Future: Sample-Efficient Policy Learning for Robotic-Arm Tasks

Cryo-em images are intrinsically low dimensional

UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis

Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach

Single-Input Multi-Output Model Merging: Leveraging Foundation Models for Dense Multi-Task Learning

Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution

Efficient Medical Image Restoration via Reliability Guided Learning in Frequency Domain

SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack

UniAnimate-DiT: Human Image Animation with Large-Scale Video Diffusion Transformer

最近の投稿

最近のコメント

アーカイブ

カテゴリー