月別アーカイブ: 2024年5月

A Nurse is Blue and Elephant is Rugby: Cross Domain Alignment in Large Language Models Reveal Human-like Patterns

要約 クロスドメイン調整とは、あるドメインから別のドメインに概念をマッピングする … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Nurse is Blue and Elephant is Rugby: Cross Domain Alignment in Large Language Models Reveal Human-like Patterns はコメントを受け付けていません

Sparse-Tuning: Adapting Vision Transformers with Efficient Fine-tuning and Inference

要約 パラメータ効率の良い微調整 (PEFT) は、事前トレーニングされたビジョ … 続きを読む

カテゴリー: cs.CV | Sparse-Tuning: Adapting Vision Transformers with Efficient Fine-tuning and Inference はコメントを受け付けていません

High Fidelity Scene Text Synthesis

要約 シーン テキストの合成には、指定されたテキストを任意の画像上にレンダリング … 続きを読む

カテゴリー: cs.AI, cs.CV | High Fidelity Scene Text Synthesis はコメントを受け付けていません

G3: An Effective and Adaptive Framework for Worldwide Geolocalization Using Large Multi-Modality Models

要約 世界規模の地理位置特定は、地球上の任意の場所で撮影された写真の座標レベルで … 続きを読む

カテゴリー: cs.AI, cs.CV | G3: An Effective and Adaptive Framework for Worldwide Geolocalization Using Large Multi-Modality Models はコメントを受け付けていません

Learning Multi-dimensional Human Preference for Text-to-Image Generation

要約 テキストから画像へのモデルの現在の指標は通常、人間の実際の好みを不適切に表 … 続きを読む

カテゴリー: cs.CV | Learning Multi-dimensional Human Preference for Text-to-Image Generation はコメントを受け付けていません

OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance

要約 リアルで自然な、唇で読み取れる話し顔ビデオを作成することは、依然として困難 … 続きを読む

カテゴリー: cs.CV, cs.MM | OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance はコメントを受け付けていません

IPDreamer: Appearance-Controllable 3D Object Generation with Complex Image Prompts

要約 最近の 3D 生成の進歩は目覚ましく、DreamFusion などの大規模 … 続きを読む

カテゴリー: cs.CV | IPDreamer: Appearance-Controllable 3D Object Generation with Complex Image Prompts はコメントを受け付けていません

Towards Cross-modal Backward-compatible Representation Learning for Vision-Language Models

要約 最新の検索システムは、古いモデルと新しいモデルの間の埋め込みに互換性がない … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Cross-modal Backward-compatible Representation Learning for Vision-Language Models はコメントを受け付けていません

SSUMamba: Spatial-Spectral Selective State Space Model for Hyperspectral Image Denoising

要約 ノイズ除去は、イメージング内のメカニズムや環境要因に起因するノイズのため、 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | SSUMamba: Spatial-Spectral Selective State Space Model for Hyperspectral Image Denoising はコメントを受け付けていません

StyleX: A Trainable Metric for X-ray Style Distances

要約 X 線技術の進歩により、放射線科医の好みに合わせて調整する必要がある多様な … 続きを読む

カテゴリー: cs.AI, cs.CV | StyleX: A Trainable Metric for X-ray Style Distances はコメントを受け付けていません