Large Language Models

Constrained Decoding of Diffusion LLMs with Context-Free Grammars

Niels Mündler, Jasper Dekoninck, Martin Vechev

arXiv 2025

Website

Paper

Code

BaxBench: Can LLMs Generate Secure and Correct Backends?

Mark Vero, Niels Mündler, Victor Chibotaru, Veselin Raychev, Maximilian Baader, Nikola Jovanović, Jingxuan He, Martin Vechev

ICML 2025 CC BY 4.0 by @fontawesome - https://fontawesome.com

Spotlight

Website

Paper

Code

Black-Box Adversarial Attacks on LLM-Based Code Completion

Slobodan Jenko*, Niels Mündler*, Jingxuan He, Mark Vero, Martin Vechev

ICML 2025 * Equal contribution

Paper

Discovering Spoofing Attempts on Language Model Watermarks

Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

ICML 2025

Paper

Code

Mind the Gap: A Practical Attack on GGUF Quantization

Kazuki Egashira, Robin Staab, Mark Vero, Jingxuan He, Martin Vechev

ICML 2025 CC BY 4.0 by @fontawesome - https://fontawesome.com

BuildingTrust@ICLR25 Oral

Paper

Code

A Unified Approach to Routing and Cascading for LLMs

Jasper Dekoninck, Maximilian Baader, Martin Vechev

ICML 2025

Paper

Code

Type-Constrained Code Generation with Language Models

Niels Mündler^†, Jingxuan He^†, Hao Wang, Koushik Sen, Dawn Song, Martin Vechev

PLDI 2025 † Co-leadership

Slides

Talk

Paper

Code

The Open Proof Corpus: A Large-Scale Study of LLM-Generated Mathematical Proofs

Jasper Dekoninck, Ivo Petrov, Kristian Minchev, Mislav Balunovic, Martin Vechev, Miroslav Marinov, Maria Drencheva, Lyuba Konova, Milen Milenov Shumanov, Kaloyan Tsvetkov, Nikolay Drenchev, Lazar D. Todorov, Kalina Nikolova, Nikolay Georgiev, Vanesa Kalinkova, Margulan Ismoldayev

arXiv 2025

Website

Paper

Code

Automated Benchmark Generation for Repository-Level Coding Tasks

Konstantinos Vergopoulos*, Mark Niklas Müller*, Martin Vechev

ICLM 2025 * Equal contribution

Paper

Code

Robust LLM Fingerprinting via Domain-Specific Watermarks

Thibaud Gloaguen, Robin Staab, Nikola Jovanović and Martin Vechev

arXiv 2025

Paper

Code

Finetuning-Activated Backdoors in LLMs

Thibaud Gloaguen, Mark Vero, Robin Staab, Martin Vechev

arXiv 2025

Paper

Code

MathArena: Evaluating LLMs on Uncontaminated Math Competitions

Mislav Balunović, Jasper Dekoninck, Nikola Jovanović, Ivo Petrov, Martin Vechev

arXiv 2025

Website

Paper

Code

Large Language Models are Advanced Anonymizers

Robin Staab, Mark Vero, Mislav Balunović, Martin Vechev

ICLR 2025

Paper

Code

Ward: Provable RAG Dataset Inference via LLM Watermarks

Nikola Jovanović, Robin Staab, Maximilian Baader, Martin Vechev

ICLR 2025

Paper

Code

Towards Watermarking of Open-Source LLMs

Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

WMARK @ ICLR 2025

Paper

Code

Black-Box Detection of Language Model Watermarks

Thibaud Gloaguen, Nikola Jovanović, Robin Staab, Martin Vechev

ICLR 2025

Paper

Polyrating: A Cost-Effective and Bias-Aware Rating System for LLM Evaluation

Jasper Dekoninck, Maximilian Baader, Martin Vechev

ICLR 2025

Paper

Code

Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad

Ivo Petrov, Jasper Dekoninck, Lyuben Baltadzhiev, Maria Drencheva, Kristian Minchev, Mislav Balunović, Nikola Jovanović, Martin Vechev

arXiv 2025

Website

Paper

Code

A Synthetic Dataset for Personal Attribute Inference

Hanna Yukhymenko, Robin Staab, Mark Vero, Martin Vechev

NeurIPS Datasets and Benchmarks 2024

Paper

Code

Exploiting LLM Quantization

Kazuki Egashira, Mark Vero, Robin Staab, Jingxuan He, Martin Vechev

NeurIPS 2024 CC BY 4.0 by @fontawesome - https://fontawesome.com

NextGenAISafety@ICML24 Oral

Website

Paper

Code

ConStat: Performance-Based Contamination Detection in Large Language Models

Jasper Dekoninck, Mark Niklas Müller, Martin Vechev

NeurIPS 2024

Website

Paper

Code

SWT-Bench: Testing and Validating Real-World Bug-Fixes with Code Agents

Niels Mündler, Mark Niklas Müller, Jingxuan He, Martin Vechev

NeurIPS 2024

Website

Paper

Code

COMPL-AI Framework: A Technical Interpretation and LLM Benchmarking Suite for the EU Artificial Intelligence Act

Philipp Guldimann, Alexander Spiridonov, Robin Staab, Nikola Jovanović, Mark Vero, Velko Vechev, Anna Gueorguieva, Mislav Balunović, Nikola Konstantinov, Pavol Bielik, Petar Tsankov, Martin Vechev

arXiv 2024

Website

Paper

Code

Watermark Stealing in Large Language Models

Nikola Jovanović, Robin Staab, Martin Vechev

ICML 2024 CC BY 4.0 by @fontawesome - https://fontawesome.com

R2-FM@ICLR24 Oral

Website

Paper

Code

Instruction Tuning for Secure Code Generation

Jingxuan He*, Mark Vero*, Gabriela Krasnopolska, Martin Vechev

ICML 2024 * Equal contribution

Paper

Code

Prompt Sketching for Large Language Models

Luca Beurer-Kellner, Mark Niklas Müller, Marc Fischer, Martin Vechev

ICML 2024

Paper

Code

Guiding LLMs The Right Way: Fast, Non-Invasive Constrained Generation

Luca Beurer-Kellner, Marc Fischer, Martin Vechev

ICML 2024

Paper

Code

Beyond Memorization: Violating Privacy Via Inference with Large Language Models

Robin Staab, Mark Vero, Mislav Balunović, Martin Vechev

ICLR 2024 CC BY 4.0 by @fontawesome - https://fontawesome.com

Spotlight, 2024 PPPM-Award

Website

Paper

Code

Self-contradictory Hallucinations of Large Language Models: Evaluation, Detection and Mitigation

Niels Mündler, Jingxuan He, Slobodan Jenko, Martin Vechev

ICLR 2024

Website

Paper

Code

Controlled Text Generation via Language Model Arithmetic

Jasper Dekoninck, Marc Fischer, Luca Beurer-Kellner, Martin Vechev

ICLR 2024 CC BY 4.0 by @fontawesome - https://fontawesome.com

Spotlight

Paper

Code

Evading Data Contamination Detection for Language Models is (too) Easy

Jasper Dekoninck, Mark Niklas Müller, Maximilian Baader, Marc Fischer, Martin Vechev

arXiv 2024

Paper

Code

Large Language Models for Code: Security Hardening and Adversarial Testing

Jingxuan He, Martin Vechev

ACM CCS 2023 CC BY 4.0 by @fontawesome - https://fontawesome.com

Distinguished Paper Award

Slides

Paper

Code

LMQL Chat: Scripted Chatbot Development

Luca Beurer-Kellner*, Marc Fischer*, Martin Vechev

Neural Conversational AI Workshop, TEACH -- ICML 2023 * Equal contribution

Paper

Code

Large Language Models are Zero-Shot Multi-Tool Users

Luca Beurer-Kellner*, Marc Fischer*, Martin Vechev

Knowlege and Logical Reasoning Workshop -- ICML 2023 * Equal contribution

Paper

Code

Prompting Is Programming: A Query Language for Large Language Models

Luca Beurer-Kellner, Marc Fischer, Martin Vechev

PLDI 2023

Paper

Code

Publications

2025

2024

2023