-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CL」カテゴリーアーカイブ
UFO: A UI-Focused Agent for Windows OS Interaction
要約 GPT-Visionの機能を活用し、Windows OS上のアプリケーショ … 続きを読む
GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse
要約 ソーシャル・メディアの急激な成長は、情報の創造、拡散、吸収の方法を大きく変 … 続きを読む
InceptionXML: A Lightweight Framework with Synchronized Negative Sampling for Short Text Extreme Classification
要約 短いテキストデータを多数のターゲットラベルに自動アノテーションすることは、 … 続きを読む
Likelihood-based Mitigation of Evaluation Bias in Large Language Models
要約 大規模言語モデル(Large Language Models: LLM)は … 続きを読む
DrAttack: Prompt Decomposition and Reconstruction Makes Powerful LLM Jailbreakers
要約 大規模言語モデル(Large Language Models: LLMs) … 続きを読む
Fortify the Shortest Stave in Attention: Enhancing Context Awareness of Large Language Models for Effective Tool Use
要約 本論文では、大規模言語モデル(LLM)の注意配分に固有の波形パターンが、L … 続きを読む
Recursive Chain-of-Feedback Prevents Performance Degradation from Redundant Prompting
要約 大規模言語モデル(LLM)は、複雑な推論タスクに苦戦することが多く、解決に … 続きを読む
Alt-Text with Context: Improving Accessibility for Images on Twitter
要約 この研究では、ソーシャルメディア、特にTwitterで共有される画像の代替 … 続きを読む
CLoVe: Encoding Compositional Language in Contrastive Vision-Language Models
要約 近年、視覚と言語のタスクの性能が著しく向上している。CLIPのような基礎的 … 続きを読む
MuLTI: Efficient Video-and-Language Understanding with Text-Guided MultiWay-Sampler and Multiple Choice Modeling
要約 ビデオと言語の理解は、ビデオ質問応答、テキスト-ビデオ検索、マルチラベル分 … 続きを読む