月別アーカイブ: 2025年4月

Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning

要約 次世代のマルチモーダル推論モデルであるSkywork R1v2と、その前身 … 続きを読む

カテゴリー: cs.CV | Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning はコメントを受け付けていません

A Time Series Dataset of NIR Spectra and RGB and NIR-HSI Images of the Barley Germination Process

要約 RGBおよびNIR-HSIのオープンソースデータセットを、関連するセグメン … 続きを読む

カテゴリー: cs.CV | A Time Series Dataset of NIR Spectra and RGB and NIR-HSI Images of the Barley Germination Process はコメントを受け付けていません

SEGA: Drivable 3D Gaussian Head Avatar from a Single Image

要約 限られた入力からフォトリアリックな3Dヘッドアバターを作成することは、仮想 … 続きを読む

カテゴリー: cs.CV, cs.GR | SEGA: Drivable 3D Gaussian Head Avatar from a Single Image はコメントを受け付けていません

A Diff-Attention Aware State Space Fusion Model for Remote Sensing Classification

要約 マルチスペクトル(MS)およびパンクロマティック(PAN)画像は同じ土地表 … 続きを読む

カテゴリー: cs.CV | A Diff-Attention Aware State Space Fusion Model for Remote Sensing Classification はコメントを受け付けていません

Representation Learning via Non-Contrastive Mutual Information

要約 ラベル付けデータは多くの場合、非常に時間がかかり、高価であるため、ほとんど … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.10, stat.ML | Representation Learning via Non-Contrastive Mutual Information はコメントを受け付けていません

SemanticSugarBeets: A Multi-Task Framework and Dataset for Inspecting Harvest and Storage Characteristics of Sugar Beets

要約 シュガービートは処理前に保管されていますが、接着土壌や過剰な植生に存在する … 続きを読む

カテゴリー: cs.CV, cs.LG | SemanticSugarBeets: A Multi-Task Framework and Dataset for Inspecting Harvest and Storage Characteristics of Sugar Beets はコメントを受け付けていません

Fast Adversarial Training with Weak-to-Strong Spatial-Temporal Consistency in the Frequency Domain on Videos

要約 敵対的な訓練(AT)は、MIN-MAX最適化アプローチを介して敵対的な堅牢 … 続きを読む

カテゴリー: cs.AI, cs.CV | Fast Adversarial Training with Weak-to-Strong Spatial-Temporal Consistency in the Frequency Domain on Videos はコメントを受け付けていません

Exploring Adversarial Transferability between Kolmogorov-arnold Networks

要約 Kolmogorov-Arnold Networks(KANS)は、変革的 … 続きを読む

カテゴリー: cs.CV | Exploring Adversarial Transferability between Kolmogorov-arnold Networks はコメントを受け付けていません

Anti-Aesthetics: Protecting Facial Privacy against Customized Text-to-Image Synthesis

要約 カスタマイズされた拡散モデルの台頭により、パーソナライズされた視覚コンテン … 続きを読む

カテゴリー: cs.CV | Anti-Aesthetics: Protecting Facial Privacy against Customized Text-to-Image Synthesis はコメントを受け付けていません

Energy-Based Pseudo-Label Refining for Source-free Domain Adaptation

要約 ソースデータへのアクセスなしでモデルを適応させることを伴うソースフリードメ … 続きを読む

カテゴリー: cs.CV | Energy-Based Pseudo-Label Refining for Source-free Domain Adaptation はコメントを受け付けていません