cs.CLcs.AI

ImplicitBBQ: Benchmarking Implicit Bias in Large Language Models through Characteristic Based Cues

Bhaskara Hanuma Vedula, Darshan Anghan, Ishita Goyal, Ponnurangam Kumaraguru, Abhijnan Chakraborty4/2/2026arxiv

This paper hasn't been summarized yet

AI Evaluation

AI analysis scores

Overall Score

Novelty85/100

Methodology90/100

Reproducibility95/100

Impact80/100

Similar Papers

UniSAFE: A Comprehensive Benchmark for Safety Evaluation of Unified Multimodal Models

arxiv

On the Identifiability of Steering Vectors in Large Language Models

arxiv

From High-Dimensional Spaces to Verifiable ODD Coverage for Safety-Critical AI-based Systems

arxiv

The Geometry of Alignment Collapse: When Fine-Tuning Breaks Safety

arxiv

Overcoming Joint Intractability with Lossless Hierarchical Speculative Decoding

arxiv