-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex and Professional Sports
要約 質問に答えるためにスポーツ ビデオを推論することは、選手のトレーニングや情 … 続きを読む
カテゴリー: cs.CV
Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex and Professional Sports はコメントを受け付けていません
Few-Shot Learner Generalizes Across AI-Generated Image Detection
要約 大規模な合成画像データセットでトレーニングされた現在の偽画像検出器は、限ら … 続きを読む
カテゴリー: cs.CV
Few-Shot Learner Generalizes Across AI-Generated Image Detection はコメントを受け付けていません
When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents
要約 最新の非参照画質評価 (NR-IQA) モデルは、知覚される画質を効果的に … 続きを読む
カテゴリー: cs.CV
When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents はコメントを受け付けていません
Admitting Ignorance Helps the Video Question Answering Models to Answer
要約 ディープラーニングと大規模な事前トレーニングのおかげで、ビデオ質問応答 ( … 続きを読む
カテゴリー: cs.CV
Admitting Ignorance Helps the Video Question Answering Models to Answer はコメントを受け付けていません
3VL: Using Trees to Improve Vision-Language Models’ Interpretability
要約 ビジョン言語モデル (VLM) は、画像とテキスト表現を調整するのに効果的 … 続きを読む
カテゴリー: cs.CV
3VL: Using Trees to Improve Vision-Language Models’ Interpretability はコメントを受け付けていません
Solving Energy-Independent Density for CT Metal Artifact Reduction via Neural Representation
要約 X 線 CT では、金属材料の存在下で影や縞模様のアーチファクトが発生し、 … 続きを読む
カテゴリー: cs.CV
Solving Energy-Independent Density for CT Metal Artifact Reduction via Neural Representation はコメントを受け付けていません
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling
要約 さまざまな画像生成および編集タスクに取り組む命令ベースの拡散フレームワーク … 続きを読む
カテゴリー: cs.CV
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling はコメントを受け付けていません
SemTalk: Holistic Co-speech Motion Generation with Frame-level Semantic Emphasis
要約 良好な共同音声動作生成は、一般的なリズミカルな動作と、まれではあるが不可欠 … 続きを読む
カテゴリー: cs.CV
SemTalk: Holistic Co-speech Motion Generation with Frame-level Semantic Emphasis はコメントを受け付けていません
Exploring ChatGPT for Face Presentation Attack Detection in Zero and Few-Shot in-Context Learning
要約 この研究は、顔提示攻撃検出 (PAD) の競合代替手段としての ChatG … 続きを読む
Structural damage detection via hierarchical damage information with volumetric assessment
要約 構造健全性モニタリング (SHM) は、インフラストラクチャの安全性と寿命 … 続きを読む
カテゴリー: cs.CV
Structural damage detection via hierarchical damage information with volumetric assessment はコメントを受け付けていません