cs.CV

T-REN: Learning Text-Aligned Region Tokens Improves Dense Vision-Language Alignment and Scalability

Savya Khosla, Sethuraman T, Aryan Chadha, Alex Schwing, Derek Hoiem4/20/2026arxiv

This paper hasn't been summarized yet

AI Evaluation

AI analysis scores

Overall Score

Novelty85/100

Methodology90/100

Reproducibility95/100

Impact88/100

Similar Papers

Panoramic Affordance Prediction

arxiv

MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

arxiv

HyPCA-Net: Advancing Multimodal Fusion in Medical Image Analysis

arxiv

TableSeq: Unified Generation of Structure, Content, and Layout

arxiv

ImLoc: Revisiting Visual Localization with Image-based Representation

arxiv