Carnegie Mellon College at EMNLP 2025 – Machine Studying Weblog

CMU researchers are presenting 50 papers on the Thirtieth Convention on Empirical Strategies in Pure Language Processing (EMNLP 2025), held from November 4 – 9 in Suzhou, China. This contains 27 papers in the principle convention, 19 papers within the Findings observe, 2 system demonstrations papers, and a couple of business observe papers. This weblog submit offers aggregated details about EMNLP 2025 papers printed by CMU researchers.

Key areas addressed are visualized under (representing 30 of the 50 whole papers), illustrating the breadth of NLP and machine studying analysis being performed at CMU :

Observe: All info on this submit has been obtained by the ACL Anthology API and the EMNLP 2025 Presentation Data spreadsheet. Please contact CMU ML Weblog editors if you need any info added or modified.

Desk of Contents

Principal Convention Papers

Findings Papers

System Demonstrations

Trade Observe Papers

Principal Convention Papers

Particular Theme: Interdisciplinary Recontextualization of NLP

MolErr2Fix: Benchmarking LLM Trustworthiness in Chemistry through Modular Error Detection, Localization, Clarification, and Correction
Yuyang Wu, Jinhui Ye, Shuhao Zhang, Lu Dai, Yonatan Bisk, Olexandr Isayev

Spontaneous Giving and Calculated Greed in Language Fashions
Yuxuan Li, Hirokazu Shirado

Artificial Socratic Debates: Analyzing Persona Results on Ethical Choice and Persuasion Dynamics
Jiarui Liu, Yueqi Track, Yunze Xiao, Mingqian Zheng, Lindia Tjuatja, Jana Schaich Borg, Mona T. Diab, Maarten Sap

Multimodality and Language Grounding to Imaginative and prescient, Robotics and Past

Social Genome: Grounded Social Reasoning Skills of Multimodal Fashions
Leena Mathur, Marian Qian, Paul Pu Liang, Louis-Philippe Morency

VisualWebInstruct: Scaling up Multimodal Instruction Knowledge by Net Search
Yiming Jia, Jiachen Li, Xiang Yue, Bo Li, Ping Nie, Kai Zou, Wenhu Chen

Figuring out & Interactively Refining Ambiguous Person Targets for Knowledge Visualization Code Technology
Mert Inan, Anthony Sicilia, Alex Xie, Saujas Vaduguru, Daniel Fried, Malihe Alikhani

Not-Simply-Scaling Legal guidelines: In the direction of a Higher Understanding of the Downstream Influence of Language Mannequin Design Selections
Emmy Liu, Amanda Bertsch, Lintang Sutawika, Lindia Tjuatja, Patrick Fernandes, Lara Marinov, Michael Chen, Shreya Singhal, Carolin Lawrence, Aditi Raghunathan, Kiril Gashteovski, Graham Neubig

Mathematical, Symbolic, and Logical Reasoning in NLP

Rewarding the Unlikely: Lifting GRPO Past Distribution Sharpening
Andre Wang He, Daniel Fried, Sean Welleck

Agentic-R1: Distilled Twin-Technique Reasoning
Weihua Du, Pranjal Aggarwal, Sean Welleck, Yiming Yang

Generalizability and Switch

SOCIAL SCAFFOLDS: A Generalization Framework for Social Understanding Duties
Ritam Dutt, Carolyn Rose, Maarten Sap

Looking for the Most Human-like Emergent Language
Brendon Boldt, David R. Mortensen

NLP Functions

PhoniTale: Phonologically Grounded Mnemonic Technology for Typologically Distant Language Pairs
Sana Kang, Myeongseok Gwon, Su Younger Kwon, Jaewook Lee, Andrew Lan, Bhiksha Raj, Rita Singh

Security and Alignment in LLMs

Anecdoctoring: Automated Crimson-Teaming Throughout Language and Place
Alejandro Cuevas, Saloni Sprint, Bharat Kumar Nayak, Dan Vann, Madeleine I. G. Daepp

Pure Language Technology

CIE: Controlling Language Mannequin Textual content Generations Utilizing Steady Indicators
Vinay Samuel, Harshita Diddee, Yiming Zhang, Daphne Ippolito

Query Answering

Desk-R1: Inference-Time Scaling for Desk Reasoning Duties
Zheyuan Yang, Lyuhao Chen, Arman Cohan, Yilun Zhao

Multilinguality and Language Variety

Grounding Multilingual Multimodal LLMs With Cultural Data
Jean De Dieu Nyandwi, Yueqi Track, Simran Khanuja, Graham Neubig

Computational Social Science, Cultural Analytics, and NLP for Social Good

Phrases Like Knives: Backstory-Customized Modeling and Detection of Violent Communication
Jocelyn J Shen, Akhila Yerukola, Xuhui Zhou, Cynthia Breazeal, Maarten Sap, Hae Gained Park

AI/LLM Brokers

On the Tremendous-Grained Planning Skills of VLM Net Brokers
Surgan Jandial, Yinong Oliver Wang, Andrea Bajcsy, Fernando De la Torre

Code Fashions

An Empirical Examine on Robust-Weak Mannequin Collaboration for Repo-level Code Technology
Shubham Gandhi, Atharva Naik, Yiqing Xie, Carolyn Rose

Summarization

Summarizing Speech: A Complete Survey
Fabian Retkowski, Maike Züfle, Andreas Sudmann, Dinah Pfau, Shinji Watanabe, Jan Niehues, Alexander Waibel

Retrieval-Augmented Language Fashions

MoR: Higher Dealing with Various Queries with a Combination of Sparse, Dense, and Human Retrievers
Jushaan Singh Kalra, Xinran Zhao, To Eun Kim, Fengyu Cai, Fernando Diaz, Tongshuang Wu

Phonology, Morphology and Phrase Segmentation

Morpheme Induction for Emergent Language
Brendon Boldt, David R. Mortensen

Low-resource Strategies for NLP

Language Fashions Could be Effectively Steered through Minimal Embedding Layer Transformations
Diogo Tavares, David Semedo, Alexander Rudnicky, Joao Magalhaes

Findings Papers

Particular Theme: Interdisciplinary Recontextualization of NLP

FicSim: A Dataset for Multi-Faceted Semantic Similarity in Lengthy-Type Fiction
Natasha Johnson, Amanda Bertsch, Maria-Emil Deal, Emma Strubell

Sources and Analysis

ResearchArena: Benchmarking Giant Language Fashions’ Means to Accumulate and Manage Data as Analysis Brokers
Hao Kang, Chenyan Xiong

SimBA: Simplifying Benchmark Evaluation Utilizing Efficiency Matrices Alone
Nishant Subramani, Alfredo Gomez, Mona T. Diab

mrCAD: Multimodal Communication to Refine Pc-aided Designs
William P McCarthy, Saujas Vaduguru, Karl D.d. Willis, Justin Matejka, Judith E Fan, Daniel Fried, Yewen Pu

Human-AI Interplay/Cooperation

Let Them Down Straightforward! Contextual Results of LLM Guardrails on Person Perceptions and Preferences
Mingqian Zheng, Wenjia Hu, Patrick Zhao, Motahhare Eslami, Jena D. Hwang, Faeze Brahman, Carolyn Rose, Maarten Sap

Interpretability, Mannequin Enhancing, Transparency, and Explainability

Linear Steerability in Language Fashions: When It Emerges and How It Evolves
Jianshu She, Xinyue Li, Eric P. Xing, Zhengzhong Liu, Qirong Ho

Predicting Language Fashions’ Success at Zero-Shot Probabilistic Prediction
Kevin Ren, Santiago Cortes-Gomez, Carlos Miguel Patiño, Ananya Joshi, Ruiqi Lyu, Jingjing Tang, Alistair Turcan, Khurram Yamin, Steven Wu, Bryan Wilder

Multilinguality and Language Variety

BenchMAX: A Complete Multilingual Analysis Suite for Giant Language Fashions
Xu Huang, Wenhao Zhu, Hanxu Hu, Conghui He, Lei Li, Shujian Huang, Fei Yuan

AI/LLM Brokers

FLAIRR-TS – Forecasting LLM-Brokers with Iterative Refinement and Retrieval for Time Collection
Gunjan Jalori, Preetika Verma, Sercan O Arik

Giant Language Mannequin Brokers in Finance: A Survey Bridging Analysis, Follow, and Actual-World Deployment
Yifei Dong, Fengyi Wu, Kunlin Zhang, Yilong Dai, Sanjian Zhang, Wanghao Ye, Sihan Chen, Zhi-Qi Cheng

Code Fashions

VisCoder: Tremendous-Tuning LLMs for Executable Python Visualization Code Technology
Yuansheng Ni, Ping Nie, Kai Zou, Xiang Yue, Wenhu Chen

Retrieval-Augmented Language Fashions

cAST: Enhancing Code Retrieval-Augmented Technology with Structural Chunking through Summary Syntax Tree
Yilin Zhang, Xinran Zhao, Zora Zhiruo Wang, Chenyang Yang, Jiayi Wei, Tongshuang Wu

GAMIC: Graph-Aligned Molecular In-context Studying for Molecule Evaluation through LLMs
Ali Al Lawati, Jason S Lucas, Zhiwei Zhang, Prasenjit Mitra, Suhang Wang

Speech Processing and Spoken Language Understanding

SVeritas: Benchmark for Sturdy Speaker Verification underneath Various Circumstances
Massa Baali, Sarthak Bisht, Francisco Teixeira, Kateryna Shapovalenko, Rita Singh, Bhiksha Raj

CAARMA: Class Augmentation with Adversarial Mixup Regularization
Massa Baali, Xiang Li, Hao Chen, Syed Abdul Hannan, Rita Singh, Bhiksha Raj

Semantics: Lexical, Sentence-Degree Semantics, Textual Inference, and Different Areas

Bridging the Enhancing Hole in LLMs: FineEdit for Exact and Focused Textual content Modifications
Yiming Zeng, Wanhao Yu, Zexin Li, Tao Ren, Yu Ma, Jinghan Cao, Xiyan Chen, Tingting Yu

Ethics, Bias, and Equity

Mitigate One, Skew One other? Tackling Intersectional Biases in Textual content-to-Picture Fashions
Pushkar Shukla, Aditya Chinchure, Emily Diana, Alexander Tolbert, Kartik Hosanagar, Vineeth N. Balasubramanian, Leonid Sigal, Matthew A. Turk

Dialogue and Interactive Techniques

Aligning Dialogue Brokers with World Suggestions through Giant Language Mannequin Multimodal Reward Decomposition
Dong Gained Lee, Hae Gained Park, Cynthia Breazeal, Louis-Philippe Morency

LLM Effectivity

TreeBoN: Enhancing Inference-Time Alignment with Speculative Tree-Search and Finest-of-N Sampling
Jiahao Qiu, Yifu Lu, Yifan Zeng, Jiacheng Guo, Jiayi Geng, Chenhao Zhu, Xinzhe Juan, Ling Yang, Huazheng Wang, Kaixuan Huang, Yue Wu, Mengdi Wang

System Demonstrations

AgentDiagnose: An Open Toolkit for Diagnosing LLM Agent Trajectories
Tianyue Ou, Wanyao Guo, Apurva Gandhi, Graham Neubig, Xiang Yue

BioGraphia: A LLM-Assisted Organic Pathway Graph Annotation Platform
Xi Xu, Sumin Jo, Adam Officer, Angela Chen, Yufei Huang, Lei Li

Trade Observe Papers

Leveraging LLMs to Streamline the Evaluate of Public Funding Functions
João DS Marques, Andre Vicente Duarte, André Mendes Marques de Carvalho, Gil Rocha, Bruno Martins, Arlindo L. Oliveira

Semantic Settlement Permits Environment friendly Open-Ended LLM Cascades
Duncan Soiffer, Steven Kolawole, Virginia Smith