adversarial-ml

Star

Here are 130 public repositories matching this topic...

Language: All

Filter by language

All 130 Python 84 Jupyter Notebook 9 HTML 4 Go 2 TypeScript 2 Julia 1 SCSS 1 TeX 1 Rich Text Format 1 Astro 1

Sort: Most stars

Sort options

Most stars Fewest stars Most forks Fewest forks Recently updated Least recently updated

depalmar / ai_for_the_win

Star 150

Build AI-powered security tools. 50+ hands-on labs covering ML, LLMs, RAG, threat detection, DFIR, and red teaming. Includes Colab notebooks, Docker environment, and CTF challenges.

python docker machine-learning ai incident-response dfir cybersecurity ctf threat-hunting xdr siem malware-analysis security-training threat-intelligence cloud-security blue-team threat-detection hands-on-labs adversarial-ml llm

Updated Jun 1, 2026
Python

AmirhosseinHonardoust / Noise-Injection-Techniques

Star 22

Noise Injection Techniques provides a comprehensive exploration of methods to make machine learning models more robust to real-world bad data. This repository explains and demonstrates Gaussian noise, dropout, mixup, masking, adversarial noise, and label smoothing, with intuitive explanations, theory, and practical code examples.

data-science machine-learning deep-learning tabular-data pytorch dropout neural-networks regularization data-augmentation data-quality noise-injection label-smoothing mixup ai-research gaussian-noise ml-engineering model-robustness adversarial-ml ml-theory ml-robustness

Updated Nov 15, 2025

AI-Security-Research-Group / LLM-Attacks

Star 17

Comprehensive taxonomy of AI security vulnerabilities, LLM adversarial attacks, prompt injection techniques, and machine learning security research. Covers 71+ attack vectors including model poisoning, agentic AI exploits, and privacy breaches.

machine-learning ai-security ai-privacy open-source-security adversarial-ml prompt-injection ai-red-teaming model-poisoning llm-attacks ai-vulnerabilities security-taxonomy

Updated Sep 19, 2025

ruwgxo / ai-security-mastery

Star 8

90-day learning path from ML fundamentals to production AI security systems

python machine-learning deep-learning jupyter-notebook owasp cybersecurity security-engineering security-research mitre-attack ai-security threat-detection open-source-book detection-engineering adversarial-ml ai-red-team prompt-injection llm-security

Updated Jun 12, 2026
Python

MadsDoodle / Detecting-the-Machine-A-Comprehensive-Benchmark-of-AI-Generated-Text-Detectors-Across-Architectures

Star 7

This project aims to address this gap by conducting a systematic, controlled study of human versus LLM-generated text detectability using paired question–answer datasets. Rather than proposing a novel detection architecture, the focus is on analyzing detection robustness, failure modes, and the impact of adversarial humanization strategies.

nlp benchmarking text-classification transformers xgboost stylometry bert model-evaluation electra perplexity roberta domain-generalization adversarial-ml ai-evaluation llm-detection ai-generated-text-detection llm-benchmarks

Updated Mar 19, 2026
Jupyter Notebook

praetorian-inc / model-extraction-demo

Star 7

An application to demonstrate stealing an AI model through knowledge distillation.

security ai model offsec adversarial-ml llm-security

Updated Dec 1, 2025
Python

tessera-ops / awesome-ai-security

Star 6

A curated list of awesome AI security tools, frameworks, and resources. OWASP AI Testing Guide, Agentic AI Top 10, EU AI Act, adversarial ML, LLM red-teaming, prompt injection.

machine-learning awesome owasp cybersecurity awesome-list ai-safety security-tools red-teaming ai-security adversarial-ml ai-testing prompt-injection llm-security agentic-ai eu-ai-act

Updated Mar 25, 2026

byoniq / AI-Redteaming

Star 6

Curated LLM/AI attack tools — prompt injection, jailbreaks, agentic threats, adversarial ML, MCP attack surface

red-teaming ai-security adversarial-ml offensive-ai prompt-injection llm-security ai-red-teaming llm-attacks

Updated May 18, 2026

issdandavis / SCBE-AETHERMOORE

Sponsor

Star 6

Geometric AI governance and evaluation framework with a 14-layer security pipeline, semantic projection, and reproducible benchmark lanes.

machine-learning cryptography post-quantum-cryptography hyperbolic-geometry multi-agent-systems autonomous-agents ai-safety security-framework ai-alignment adversarial-ml ai-governance poincare-ball ai-red-team prompt-injection llm-security patent-pending ai-firewall runtime-governance sacred-tongues geometric-security

Updated Jun 13, 2026
Python

emmanuelgjr / GenAI-Security-Literature-Review

Star 5

Comprehensive, auto-updating literature review of GenAI & LLM security research, standards, tools, and resources. 100+ curated entries with interactive webapp.

owasp cybersecurity jailbreaking ai-safety literature-review red-teaming machine-learning-security ai-security adversarial-ml mitre-atlas prompt-injection llm-security genai-security agentic-ai nist-ai-rmf

Updated Jun 8, 2026
Python

bb1nfosec / dvai

Star 5

DVAI - Damn Vulnerable AI Ecosystem. Open-source, zero-infrastructure-cost AI red team training range.

nextjs ctf red-team ai-security groq vercel adversarial-ml prompt-injection mutation-engine logprob

Updated May 28, 2026
TypeScript

sparckix / ztare

Star 4

Zero-Trust Adversarial Reasoning Engine - autoresearch inspired kernel to create and validate claims.

ai artificial-intelligence formal-verification multi-agent-systems ai-safety zero-trust ai-alignment adversarial-robustness neurosymbolic lean4 adversarial-ml trustworthy-ai ai-governance llm-evaluation recursive-ai

Updated Jun 10, 2026
Python

krishnakaanthreddyy1510-cell / RedSOC

Star 4

An adversarial evaluation framework for LLM-integrated Security Operations Centers

python cybersecurity soc red-teaming ai-security adversarial-ml large-language-models prompt-injection llm-security rag-security

Updated May 5, 2026
Python

clolomagico123 / ai-security-lab

Star 4

🤖 Test and secure AI systems with advanced techniques for Large Language Models, including jailbreaks and automated vulnerability scanners.

incident-response dfir ctf offensive-security blue-team adversarial-attacks ai-security cybersecurity-education hands-on-labs adversarial-ml llm ai-red-team prompt-injection langchain-alternative agentic-ai-security llm-attacks

Updated Jun 14, 2026

zakky8 / llm-jailbreak-taxonomy

Star 3

Mechanism-grounded taxonomy of 40 LLM jailbreak patterns across 10 categories. 8,000-trial bootstrap evaluation for the June 2026 frontier (Claude Opus 4-8, GPT-5.5, Gemini 3.5, DeepSeek V4). Every citation direct-WebFetch verified; refuted claims documented.

taxonomy jailbreak alignment ai-safety security-testing responsible-disclosure jailbreak-detection adversarial-attacks red-teaming ai-security model-robustness adversarial-ml prompt-injection red-teaming-tools llm-security llm-evaluation llm-jailbreaks ai-red-teaming adversarial-testing

Updated Jun 2, 2026
Jupyter Notebook

failurefirst / failure-first

Star 3

Adversarial evaluation framework for embodied and agentic AI — failure-first methodology, jailbreak corpus, VLA red-teaming, and policy research.

benchmark robotics jailbreak alignment vla ai-safety red-teaming failure-analysis responsible-ai embodied-ai adversarial-ml llm-evaluation safety-research agentic-ai

Updated Jun 11, 2026
Astro

Ashfaaq98 / ai-security-research

Star 3

A collection of resources documenting my research and learning journey in AI System Security.

research resources ai-security adversarial-ml llm-security agentic-ai ai-red-teaming

Updated May 21, 2026

ParraX123 / meta-ai-bug-bounty

Star 3

🛡️ Discover and analyze critical vulnerabilities in Meta AI's Instagram Group Chat, ensuring robust security through comprehensive testing and reporting.

cybersecurity penetration-testing ethical-hacking responsible-disclosure security-research mitre-attack red-teaming ai-security ai-risk adversarial-ml mitre-atlas prompt-injection meta-ai llm-vulnerabilities

Updated Jun 14, 2026

shahram-h-hesari / ai-ml-wifi-sensing-hub

Star 2

Open research hub mapping AI/ML WiFi sensing papers, datasets, code, reproducibility, and security gaps, starting with healthcare-relevant sensing.

machine-learning signal-processing artificial-intelligence dataset cybersecurity csi wifi-sensing healthcare-ai adversarial-ml wireless-sensing

Updated Jun 1, 2026

kakashi-kx / WAFMANCER

Star 2

🧠 WAFMANCER v2.0 — Next-Gen WAF Evasion Framework. AI-powered payload synthesis. Trust-based WAF manipulation. Bypassed Cloudflare. 50+ mutations. PoC generator. "Not a tool. A research weapon." 🔥

python cloudflare penetration-testing bug-bounty web-security offensive-security hacking-tool red-team payload-generator zero-day security-research ai-security security-tool adversarial-ml waf-bypass-tool

Updated May 1, 2026
Python

Improve this page

Add a description, image, and links to the adversarial-ml topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the adversarial-ml topic, visit your repo's landing page and select "manage topics."

Learn more

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

adversarial-ml

Here are 130 public repositories matching this topic...

depalmar / ai_for_the_win

AmirhosseinHonardoust / Noise-Injection-Techniques

AI-Security-Research-Group / LLM-Attacks

ruwgxo / ai-security-mastery

MadsDoodle / Detecting-the-Machine-A-Comprehensive-Benchmark-of-AI-Generated-Text-Detectors-Across-Architectures

praetorian-inc / model-extraction-demo

tessera-ops / awesome-ai-security

byoniq / AI-Redteaming

issdandavis / SCBE-AETHERMOORE

emmanuelgjr / GenAI-Security-Literature-Review

bb1nfosec / dvai

sparckix / ztare

krishnakaanthreddyy1510-cell / RedSOC

clolomagico123 / ai-security-lab

zakky8 / llm-jailbreak-taxonomy

failurefirst / failure-first

Ashfaaq98 / ai-security-research

ParraX123 / meta-ai-bug-bounty

shahram-h-hesari / ai-ml-wifi-sensing-hub

kakashi-kx / WAFMANCER

Improve this page

Add this topic to your repo