-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model
要約 PSALM は、セグメンテーション タスクの課題に対処するための大規模マル … 続きを読む
カテゴリー: cs.CV
PSALM: Pixelwise SegmentAtion with Large Multi-Modal Model はコメントを受け付けていません
MyVLM: Personalizing VLMs for User-Specific Queries
要約 最近の大規模ビジョン言語モデル (VLM) は、視覚コンテンツのテキスト説 … 続きを読む
カテゴリー: cs.CV
MyVLM: Personalizing VLMs for User-Specific Queries はコメントを受け付けていません
ReNoise: Real Image Inversion Through Iterative Noising
要約 テキストガイド付き拡散モデルの最近の進歩により、強力な画像操作機能が解放さ … 続きを読む
T-Rex2: Towards Generic Object Detection via Text-Visual Prompt Synergy
要約 オープンセット物体検出のための非常に実用的なモデルである T-Rex2 を … 続きを読む
カテゴリー: cs.CV
T-Rex2: Towards Generic Object Detection via Text-Visual Prompt Synergy はコメントを受け付けていません
Explorative Inbetweening of Time and Space
要約 特定の開始フレームと終了フレームのみに基づいて任意のカメラと被写体の動きを … 続きを読む
カテゴリー: cs.CV
Explorative Inbetweening of Time and Space はコメントを受け付けていません
DreamReward: Text-to-3D Generation with Human Preference
要約 テキスト プロンプトからの 3D コンテンツ作成は、最近目覚ましい成功を収 … 続きを読む
AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation
要約 画像取得プロセスでは、ノイズ、かすみ、雨などのさまざまな形の劣化が頻繁に発 … 続きを読む
カテゴリー: cs.CV
AdaIR: Adaptive All-in-One Image Restoration via Frequency Mining and Modulation はコメントを受け付けていません
Hierarchical Text-to-Vision Self Supervised Alignment for Improved Histopathology Representation Learning
要約 自己教師あり表現学習は、より良い表現を学習するために患者-スライド-パッチ … 続きを読む
カテゴリー: cs.CV
Hierarchical Text-to-Vision Self Supervised Alignment for Improved Histopathology Representation Learning はコメントを受け付けていません
Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion
要約 ローカライズされたセマンティック編集のためのトレーニング不要のビデオ編集ア … 続きを読む
ClusteringSDF: Self-Organized Neural Implicit Surfaces for 3D Decomposition
要約 注釈付きの大規模な 3D データがすぐに入手できないため、3D 分解/セグ … 続きを読む
カテゴリー: cs.CV
ClusteringSDF: Self-Organized Neural Implicit Surfaces for 3D Decomposition はコメントを受け付けていません