月別アーカイブ: 2024年4月

SemGrasp: Semantic Grasp Generation via Language Aligned Discretization

要約 人間の自然な把持を生成するためには、物体の形状だけでなく、意味情報も考慮す … 続きを読む

カテゴリー: cs.AI, cs.CV | SemGrasp: Semantic Grasp Generation via Language Aligned Discretization はコメントを受け付けていません

InsectMamba: Insect Pest Classification with State Space Model

要約 害虫の分類は農業技術において重要な課題であり、食糧安全保障と環境の持続可能 … 続きを読む

カテゴリー: cs.AI, cs.CV | InsectMamba: Insect Pest Classification with State Space Model はコメントを受け付けていません

Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting

要約 3D Gaussian Splatting (3DGS)は高速かつ高品質な … 続きを読む

カテゴリー: cs.CV | Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting はコメントを受け付けていません

On the Efficiency of Convolutional Neural Networks

要約 2012年のAlexNetの画期的な性能以来、畳み込みニューラルネットワー … 続きを読む

カテゴリー: cs.CV, cs.LG | On the Efficiency of Convolutional Neural Networks はコメントを受け付けていません

DeViDe: Faceted medical knowledge for improved medical vision-language pre-training

要約 胸部X線写真の視覚言語事前訓練は、主に対になったX線写真と放射線診断報告書 … 続きを読む

カテゴリー: cs.CV | DeViDe: Faceted medical knowledge for improved medical vision-language pre-training はコメントを受け付けていません

LCM-Lookahead for Encoder-based Text-to-Image Personalization

要約 最近の拡散モデルの進歩により、わずか1~数ステップのノイズ除去で高品質な画 … 続きを読む

カテゴリー: cs.CV, cs.GR | LCM-Lookahead for Encoder-based Text-to-Image Personalization はコメントを受け付けていません

Robust Concept Erasure Using Task Vectors

要約 テキストから画像への変換モデルの急速な発展に伴い、望ましくない画像生成を防 … 続きを読む

カテゴリー: cs.CV | Robust Concept Erasure Using Task Vectors はコメントを受け付けていません

Reference-Based 3D-Aware Image Editing with Triplane

要約 Generative Adversarial Networks(GAN)は … 続きを読む

カテゴリー: cs.CV | Reference-Based 3D-Aware Image Editing with Triplane はコメントを受け付けていません

PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments

要約 2本指グリッパーを用いた把持不可能な物体のロボット操作は、把持可能な特徴が … 続きを読む

カテゴリー: cs.CV, cs.RO | PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments はコメントを受け付けていません

WorDepth: Variational Language Prior for Monocular Depth Estimation

要約 1枚の画像からの3次元(3D)再構成は、スケールなどの曖昧さを内在する非投 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | WorDepth: Variational Language Prior for Monocular Depth Estimation はコメントを受け付けていません