cs.CV」カテゴリーアーカイブ

VL-GLUE: A Suite of Fundamental yet Challenging Visuo-Linguistic Reasoning Tasks

要約 異種入力 (画像、テキスト、音声など) から推論を導き出すことは、人間が日 … 続きを読む

カテゴリー: cs.CL, cs.CV | VL-GLUE: A Suite of Fundamental yet Challenging Visuo-Linguistic Reasoning Tasks はコメントを受け付けていません

PTQ4DiT: Post-training Quantization for Diffusion Transformers

要約 最近導入された拡散トランスフォーマー (DiT) は、従来の U-Net … 続きを読む

カテゴリー: cs.CV | PTQ4DiT: Post-training Quantization for Diffusion Transformers はコメントを受け付けていません

Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion

要約 低品質または希少なデータは、実際にディープ ニューラル ネットワークをトレ … 続きを読む

カテゴリー: cs.AI, cs.CV | Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion はコメントを受け付けていません

Pose-Based Sign Language Appearance Transfer

要約 手話の内容を保持したまま、手話の骨格ポーズで署名者の外観を転送する方法を紹 … 続きを読む

カテゴリー: cs.CL, cs.CV | Pose-Based Sign Language Appearance Transfer はコメントを受け付けていません

FlashTex: Fast Relightable Mesh Texturing with LightControlNet

要約 3D メッシュのテクスチャを手動で作成するのは、熟練したビジュアル コンテ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | FlashTex: Fast Relightable Mesh Texturing with LightControlNet はコメントを受け付けていません

Label-free prediction of fluorescence markers in bovine satellite cells using deep learning

要約 ウシ衛星細胞 (BSC) の品質を評価することは、世界的な食料の持続可能性 … 続きを読む

カテゴリー: cs.CV | Label-free prediction of fluorescence markers in bovine satellite cells using deep learning はコメントを受け付けていません

Beyond Coarse-Grained Matching in Video-Text Retrieval

要約 ビデオテキストの検索は大幅に進歩しましたが、キャプションの微妙な違いを識別 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Beyond Coarse-Grained Matching in Video-Text Retrieval はコメントを受け付けていません

Exploring the Design Space of Visual Context Representation in Video MLLMs

要約 ビデオ マルチモーダル大規模言語モデル (MLLM) は、さまざまな下流タ … 続きを読む

カテゴリー: cs.CL, cs.CV | Exploring the Design Space of Visual Context Representation in Video MLLMs はコメントを受け付けていません

LieRE: Generalizing Rotary Position Encodings

要約 大規模な言語モデルに対するロータリー ポジション エンベディング (RoP … 続きを読む

カテゴリー: cs.CV, cs.LG | LieRE: Generalizing Rotary Position Encodings はコメントを受け付けていません

Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments

要約 この研究では、商業果樹園における緑色の果物の検出のために、YOLOv8、Y … 続きを読む

カテゴリー: cs.AI, cs.CV | Comprehensive Performance Evaluation of YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments はコメントを受け付けていません