月別アーカイブ: 2024年9月

Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale

要約 大規模言語モデル (LLM) は、計画と推論を必要とするマルチモーダルなタ … 続きを読む

カテゴリー: cs.AI | Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale はコメントを受け付けていません

AnySkin: Plug-and-play Skin Sensing for Robotic Touch

要約 触覚センシングは重要かつ有用なセンシングモダリティとして広く受け入れられて … 続きを読む

カテゴリー: cs.AI, cs.RO | AnySkin: Plug-and-play Skin Sensing for Robotic Touch はコメントを受け付けていません

DEAR: Depth-Enhanced Action Recognition

要約 ビデオ、特に乱雑なシーン内のアクションを検出することは、カメラの観点から見 … 続きを読む

カテゴリー: cs.CV | DEAR: Depth-Enhanced Action Recognition はコメントを受け付けていません

Thermal3D-GS: Physics-induced 3D Gaussians for Thermal Infrared Novel-view Synthesis

要約 可視光に基づいた斬新な視点の合成は広く研究されています。 可視光イメージン … 続きを読む

カテゴリー: cs.CV, cs.GR, I.3.3 | Thermal3D-GS: Physics-induced 3D Gaussians for Thermal Infrared Novel-view Synthesis はコメントを受け付けていません

GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning

要約 フォトリアリスティック ジェネレーターの急速な進歩により、本物の画像と加工 … 続きを読む

カテゴリー: cs.CV | GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning はコメントを受け付けていません

Learning Video Context as Interleaved Multimodal Sequences

要約 映画などのナラティブビデオは、その豊富なコンテキスト (キャラクター、会話 … 続きを読む

カテゴリー: cs.CV, cs.MM | Learning Video Context as Interleaved Multimodal Sequences はコメントを受け付けていません

Expansive Supervision for Neural Radiance Field

要約 Neural Radiance Fields は、その優れた再構成機能によ … 続きを読む

カテゴリー: cs.CV | Expansive Supervision for Neural Radiance Field はコメントを受け付けていません

NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks

要約 量子化は、ディープ ニューラル ネットワーク (DNN) の着実に増加する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE, I.2.6 | NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks はコメントを受け付けていません

AutoPET Challenge: Tumour Synthesis for Data Augmentation

要約 全身 PET/CT スキャンにおける正確な病変セグメンテーションは、がんの … 続きを読む

カテゴリー: cs.CV, eess.IV, physics.med-ph | AutoPET Challenge: Tumour Synthesis for Data Augmentation はコメントを受け付けていません

Diffusion-Based Image-to-Image Translation by Noise Correction via Prompt Interpolation

要約 私たちは、拡散ベースの画像間の変換に合わせた、シンプルだが効果的なトレーニ … 続きを読む

カテゴリー: cs.CV | Diffusion-Based Image-to-Image Translation by Noise Correction via Prompt Interpolation はコメントを受け付けていません