月別アーカイブ: 2024年3月

PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model

要約 PSALM は、セグメンテーション タスクの課題に対処するための大規模マル … 続きを読む

カテゴリー: cs.CV | PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model はコメントを受け付けていません

MyVLM: Personalizing VLMs for User-Specific Queries

要約 最近の大規模ビジョン言語モデル (VLM) は、視覚コンテンツのテキスト説 … 続きを読む

カテゴリー: cs.CV | MyVLM: Personalizing VLMs for User-Specific Queries はコメントを受け付けていません

ReNoise: Real Image Inversion Through Iterative Noising

要約 テキストガイド付き拡散モデルの最近の進歩により、強力な画像操作機能が解放さ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, eess.IV | ReNoise: Real Image Inversion Through Iterative Noising はコメントを受け付けていません

T-Rex2: Towards Generic Object Detection via Text-Visual Prompt Synergy

要約 オープンセット物体検出のための非常に実用的なモデルである T-Rex2 を … 続きを読む

カテゴリー: cs.CV | T-Rex2: Towards Generic Object Detection via Text-Visual Prompt Synergy はコメントを受け付けていません

Explorative Inbetweening of Time and Space

要約 特定の開始フレームと終了フレームのみに基づいて任意のカメラと被写体の動きを … 続きを読む

カテゴリー: cs.CV | Explorative Inbetweening of Time and Space はコメントを受け付けていません

DreamReward: Text-to-3D Generation with Human Preference

要約 テキスト プロンプトからの 3D コンテンツ作成は、最近目覚ましい成功を収 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | DreamReward: Text-to-3D Generation with Human Preference はコメントを受け付けていません

AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation

要約 画像取得プロセスでは、ノイズ、かすみ、雨などのさまざまな形の劣化が頻繁に発 … 続きを読む

カテゴリー: cs.CV | AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation はコメントを受け付けていません

Hierarchical Text-to-Vision Self Supervised Alignment for Improved Histopathology Representation Learning

要約 自己教師あり表現学習は、より良い表現を学習するために患者-スライド-パッチ … 続きを読む

カテゴリー: cs.CV | Hierarchical Text-to-Vision Self Supervised Alignment for Improved Histopathology Representation Learning はコメントを受け付けていません

Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion

要約 ローカライズされたセマンティック編集のためのトレーニング不要のビデオ編集ア … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion はコメントを受け付けていません

ClusteringSDF: Self-Organized Neural Implicit Surfaces for 3D Decomposition

要約 注釈付きの大規模な 3D データがすぐに入手できないため、3D 分解/セグ … 続きを読む

カテゴリー: cs.CV | ClusteringSDF: Self-Organized Neural Implicit Surfaces for 3D Decomposition はコメントを受け付けていません