-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Liquid: Language Models are Scalable Multi-modal Generators
要約 私たちは、画像を個別のコードにトークン化し、視覚と言語の両方の共有特徴空間 … 続きを読む
カテゴリー: cs.CV
Liquid: Language Models are Scalable Multi-modal Generators はコメントを受け付けていません
Can Modern LLMs Act as Agent Cores in Radiology~Environments?
要約 大規模言語モデル (LLM) の進歩により、さまざまなドメインにわたって精 … 続きを読む
カテゴリー: cs.CV
Can Modern LLMs Act as Agent Cores in Radiology~Environments? はコメントを受け付けていません
Dynamic-VLM: Simple Dynamic Visual Token Compression for VideoLLM
要約 画像やビデオを分析するためのラージ ビジョン言語モデル (LVLM) のア … 続きを読む
カテゴリー: cs.CV
Dynamic-VLM: Simple Dynamic Visual Token Compression for VideoLLM はコメントを受け付けていません
Disentangling Mean Embeddings for Better Diagnostics of Image Generators
要約 画像ジェネレーターの評価は、特定の画像領域に対する微妙な洞察を提供する際の … 続きを読む
Altogether: Image Captioning via Re-aligning Alt-text
要約 このペーパーでは、画像キャプションの品質を向上させるための合成データの作成 … 続きを読む
SimAvatar: Simulation-Ready Avatars with Layered Hair and Clothing
要約 SimAvatar は、テキスト プロンプトからシミュレーション対応の服を … 続きを読む
Meshtron: High-Fidelity, Artist-Like 3D Mesh Generation at Scale
要約 メッシュは 3D サーフェスの基本的な表現です。 ただし、高品質のメッシュ … 続きを読む
Exemplar Masking for Multimodal Incremental Learning
要約 マルチモーダル増分学習では、以前に学習した情報を忘れることなく、新しい知識 … 続きを読む
カテゴリー: cs.CV
Exemplar Masking for Multimodal Incremental Learning はコメントを受け付けていません
Video Creation by Demonstration
要約 私たちは、新しいビデオ作成体験、つまりデモンストレーションによるビデオ作成 … 続きを読む
カテゴリー: cs.CV
Video Creation by Demonstration はコメントを受け付けていません
Leveraging Medical Foundation Model Features in Graph Neural Network-Based Retrieval of Breast Histopathology Images
要約 乳がんは、世界中の女性に最も多いがんの種類です。 早期発見と適切な治療によ … 続きを読む
カテゴリー: cs.CV
Leveraging Medical Foundation Model Features in Graph Neural Network-Based Retrieval of Breast Histopathology Images はコメントを受け付けていません