-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Lumina-mGPT: Illuminate Flexible Photorealistic Text-to-Image Generation with Multimodal Generative Pretraining
要約 さまざまなビジョンや言語タスクが可能なマルチモーダルの自己回帰モデルのファ … 続きを読む
カテゴリー: cs.CV
Lumina-mGPT: Illuminate Flexible Photorealistic Text-to-Image Generation with Multimodal Generative Pretraining はコメントを受け付けていません
DDU-Net: A Domain Decomposition-Based CNN for High-Resolution Image Segmentation on Multiple GPUs
要約 超高解像度画像のセグメンテーションは、空間情報の喪失や計算非効率性などの課 … 続きを読む
jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images
要約 対照的な言語イメージ前削除(CLIP)は、クロスモーダル情報の検索およびマ … 続きを読む
CasualHDRSplat: Robust High Dynamic Range 3D Gaussian Splatting from Casually Captured Videos
要約 最近、ニューラル放射輝度フィールド(NERF)や3Dガウスのスプラッティン … 続きを読む
DPMambaIR:All-in-One Image Restoration via Degradation-Aware Prompt State Space Model
要約 オールインワン画像の修復は、単一のモデルを使用して複数の画像劣化の問題に対 … 続きを読む
EgoCHARM: Resource-Efficient Hierarchical Activity Recognition using an Egocentric IMU Sensor
要約 SmartGlassesの人間の活動認識(HAR)には、健康/フィットネス … 続きを読む
Step1X-Edit: A Practical Framework for General Image Editing
要約 近年、画像編集モデルは驚くべき急速な発展を目撃しています。 GPT-4Oや … 続きを読む
カテゴリー: cs.CV
Step1X-Edit: A Practical Framework for General Image Editing はコメントを受け付けていません
ImageFlowNet: Forecasting Multiscale Image-Level Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images
要約 医療画像技術の進歩により、疾患の進行を監視するために、同じ患者の繰り返しス … 続きを読む
DiffKillR: Killing and Recreating Diffeomorphisms for Cell Annotation in Dense Microscopy Images
要約 自動化された全体のスライドスキャンの進歩によって駆動されるデジタル顕微鏡画 … 続きを読む
カテゴリー: cs.CV
DiffKillR: Killing and Recreating Diffeomorphisms for Cell Annotation in Dense Microscopy Images はコメントを受け付けていません
HierarQ: Task-Aware Hierarchical Q-Former for Enhanced Video Understanding
要約 マルチモーダルの大手言語モデル(MLLM)の進歩にもかかわらず、現在のアプ … 続きを読む
カテゴリー: cs.CV
HierarQ: Task-Aware Hierarchical Q-Former for Enhanced Video Understanding はコメントを受け付けていません