投稿者「jarxiv」のアーカイブ

Mamba-Based Ensemble learning for White Blood Cell Classification

要約 白血球(WBC)の分類は、免疫の健康の評価とさまざまな疾患の診断に役立ちま … 続きを読む

カテゴリー: cs.CV, cs.LG | Mamba-Based Ensemble learning for White Blood Cell Classification はコメントを受け付けていません

TADACap: Time-series Adaptive Domain-Aware Captioning

要約 画像キャプションは大きな注目を集めていますが、金融やヘルスケアなどの分野で … 続きを読む

カテゴリー: cs.CL, cs.CV | TADACap: Time-series Adaptive Domain-Aware Captioning はコメントを受け付けていません

Reference-Based 3D-Aware Image Editing with Triplanes

要約 生成的敵対ネットワーク(GAN)は、潜在スペースを操作することにより、高品 … 続きを読む

カテゴリー: cs.CV | Reference-Based 3D-Aware Image Editing with Triplanes はコメントを受け付けていません

Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion

要約 3D LIDARシーンの完了における拡散モデルの適用は、拡散のサンプリング … 続きを読む

カテゴリー: cs.CV | Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion はコメントを受け付けていません

PARTFIELD: Learning 3D Feature Fields for Part Segmentation and Beyond

要約 Partfieldを提案します。これは、定義済みのテンプレートやテキストベ … 続きを読む

カテゴリー: cs.CV | PARTFIELD: Learning 3D Feature Fields for Part Segmentation and Beyond はコメントを受け付けていません

SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL

要約 この作業は、複雑なアーキテクチャの変更なしに、バニラの自己回帰視覚生成フレ … 続きを読む

カテゴリー: cs.CV | SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL はコメントを受け付けていません

Aligning Generative Denoising with Discriminative Objectives Unleashes Diffusion for Visual Perception

要約 画像生成の成功に伴い、ピクセル生成が統一された知覚インターフェイスを提供す … 続きを読む

カテゴリー: cs.CV | Aligning Generative Denoising with Discriminative Objectives Unleashes Diffusion for Visual Perception はコメントを受け付けていません

MultiLoKo: a multilingual local knowledge benchmark for LLMs spanning 31 languages

要約 31の言語をカバーするLLMSの多言語性を評価するための新しいベンチマーク … 続きを読む

カテゴリー: cs.CL | MultiLoKo: a multilingual local knowledge benchmark for LLMs spanning 31 languages はコメントを受け付けていません

Weight Ensembling Improves Reasoning in Language Models

要約 推論モデルのトレーニング中に発生する障害モードを調査します。そこでは、世代 … 続きを読む

カテゴリー: cs.AI, cs.LG | Weight Ensembling Improves Reasoning in Language Models はコメントを受け付けていません

LL-Gaussian: Low-Light Scene Reconstruction and Enhancement via Gaussian Splatting for Novel View Synthesis

要約 低光光シーンでの新規ビュー合成(NVS)は、重度のノイズ、低ダイナミックレ … 続きを読む

カテゴリー: cs.CV | LL-Gaussian: Low-Light Scene Reconstruction and Enhancement via Gaussian Splatting for Novel View Synthesis はコメントを受け付けていません