投稿者「jarxiv」のアーカイブ

AxBench: Steering LLMs? Even Simple Baselines Outperform Sparse Autoencoders

要約 言語モデルの出力の細かいステアリングは、安全性と信頼性に不可欠です。 これ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.7 | AxBench: Steering LLMs? Even Simple Baselines Outperform Sparse Autoencoders はコメントを受け付けていません

Three-Dimensional Diffusion-Weighted Multi-Slab MRI With Slice Profile Compensation Using Deep Energy Model

要約 3次元(3D)マルチスラブ獲得は、最高の信号対雑音比(SNR)効率を達成す … 続きを読む

カテゴリー: cs.AI, eess.IV, physics.med-ph | Three-Dimensional Diffusion-Weighted Multi-Slab MRI With Slice Profile Compensation Using Deep Energy Model はコメントを受け付けていません

AdaSemSeg: An Adaptive Few-shot Semantic Segmentation of Seismic Facies

要約 ディープラーニング方法を使用した地震画像の自動化された解釈は、トレーニング … 続きを読む

カテゴリー: cs.CV, cs.LG | AdaSemSeg: An Adaptive Few-shot Semantic Segmentation of Seismic Facies はコメントを受け付けていません

DiffSplat: Repurposing Image Diffusion Models for Scalable Gaussian Splat Generation

要約 テキストまたは単一の画像からの3Dコンテンツ生成における最近の進歩は、限ら … 続きを読む

カテゴリー: cs.CV | DiffSplat: Repurposing Image Diffusion Models for Scalable Gaussian Splat Generation はコメントを受け付けていません

Target-driven Self-Distillation for Partial Observed Trajectories Forecasting

要約 交通エージェントの将来の軌跡の正確な予測は、安全な自律運転を確保するために … 続きを読む

カテゴリー: cs.CV | Target-driven Self-Distillation for Partial Observed Trajectories Forecasting はコメントを受け付けていません

Beyond-Labels: Advancing Open-Vocabulary Segmentation With Vision-Language Models

要約 自己学習学習は、効果的に訓練された場合、多数の画像または言語処理の問題を解 … 続きを読む

カテゴリー: cs.CV | Beyond-Labels: Advancing Open-Vocabulary Segmentation With Vision-Language Models はコメントを受け付けていません

FlexMotion: Lightweight, Physics-Aware, and Controllable Human Motion Generation

要約 軽量で制御可能で、身体的にもっともらしい人間の動きの合成は、アニメーション … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | FlexMotion: Lightweight, Physics-Aware, and Controllable Human Motion Generation はコメントを受け付けていません

Conterfactual Generative Zero-Shot Semantic Segmentation

要約 ゼロショット学習は、コンピュータービジョンの重要な部分です。 古典的なダウ … 続きを読む

カテゴリー: 68T07, cs.CV, I.2.10 | Conterfactual Generative Zero-Shot Semantic Segmentation はコメントを受け付けていません

Exploring the Role of Explicit Temporal Modeling in Multimodal Large Language Models for Video Understanding

要約 マルチモーダル大手言語モデル(MLLM)をビデオ理解に適用することは、フレ … 続きを読む

カテゴリー: cs.CL, cs.CV | Exploring the Role of Explicit Temporal Modeling in Multimodal Large Language Models for Video Understanding はコメントを受け付けていません

Slot-Guided Adaptation of Pre-trained Diffusion Models for Object-Centric Learning and Compositional Generation

要約 スロットベースのコンディショニングにアダプターを導入することにより、スロッ … 続きを読む

カテゴリー: cs.CV, cs.LG | Slot-Guided Adaptation of Pre-trained Diffusion Models for Object-Centric Learning and Compositional Generation はコメントを受け付けていません