cs.CV」カテゴリーアーカイブ

Leveraging multimodal explanatory annotations for video interpretation with Modality Specific Dataset

要約 人間が注目した説明概念を含むデータセットであるMobygazeを使用して、 … 続きを読む

カテゴリー: cs.CV, cs.MM | Leveraging multimodal explanatory annotations for video interpretation with Modality Specific Dataset はコメントを受け付けていません

Next-Future: Sample-Efficient Policy Learning for Robotic-Arm Tasks

要約 Hindsight Experience Replay(彼女)は、バイナリ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Next-Future: Sample-Efficient Policy Learning for Robotic-Arm Tasks はコメントを受け付けていません

Cryo-em images are intrinsically low dimensional

要約 シミュレーションベースの推論は、クレオスビなどの方法でニューラルネットワー … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.BM, q-bio.QM, stat.ML | Cryo-em images are intrinsically low dimensional はコメントを受け付けていません

UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis

要約 大規模なビジョン言語モデルの最近の進歩は、デジタルデバイスの生産性を高める … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis はコメントを受け付けていません

Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach

要約 情報技術の急速な発展に伴い、近代的な戦争はますます知性に依存しており、軍事 … 続きを読む

カテゴリー: cs.CV | Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach はコメントを受け付けていません

Single-Input Multi-Output Model Merging: Leveraging Foundation Models for Dense Multi-Task Learning

要約 モデルのマージは、シングルタスクチェックポイントをマルチタスクモデルに融合 … 続きを読む

カテゴリー: cs.AI, cs.CV | Single-Input Multi-Output Model Merging: Leveraging Foundation Models for Dense Multi-Task Learning はコメントを受け付けていません

Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution

要約 畳み込みニューラルネットワーク(CNNS)は、効率的な画像超解像度で広く使 … 続きを読む

カテゴリー: cs.CV | Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution はコメントを受け付けていません

Efficient Medical Image Restoration via Reliability Guided Learning in Frequency Domain

要約 医療画像の修復タスクは、低用量のCT画像除去、MRI超解像度、MRIアーテ … 続きを読む

カテゴリー: cs.CV, eess.IV | Efficient Medical Image Restoration via Reliability Guided Learning in Frequency Domain はコメントを受け付けていません

SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack

要約 敏感な環境に展開された深いニューラルネットワークベースのシステムは、敵対的 … 続きを読む

カテゴリー: cs.AI, cs.CV | SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack はコメントを受け付けていません

UniAnimate-DiT: Human Image Animation with Large-Scale Video Diffusion Transformer

要約 このレポートでは、一貫した人間のイメージアニメーションのためのオープンソー … 続きを読む

カテゴリー: cs.CV | UniAnimate-DiT: Human Image Animation with Large-Scale Video Diffusion Transformer はコメントを受け付けていません