Build software better, together

depalmar / ai_for_the_win

Build AI-powered security tools. 50+ hands-on labs covering ML, LLMs, RAG, threat detection, DFIR, and red teaming. Includes Colab notebooks, Docker environment, and CTF challenges.

Updated Jan 30, 2026
Python

AmirhosseinHonardoust / Noise-Injection-Techniques

Star

Noise Injection Techniques provides a comprehensive exploration of methods to make machine learning models more robust to real-world bad data. This repository explains and demonstrates Gaussian noise, dropout, mixup, masking, adversarial noise, and label smoothing, with intuitive explanations, theory, and practical code examples.

Updated Nov 15, 2025

AI-Security-Research-Group / LLM-Attacks

Star

Comprehensive taxonomy of AI security vulnerabilities, LLM adversarial attacks, prompt injection techniques, and machine learning security research. Covers 71+ attack vectors including model poisoning, agentic AI exploits, and privacy breaches.

machine-learning ai-security ai-privacy open-source-security adversarial-ml prompt-injection ai-red-teaming model-poisoning llm-attacks ai-vulnerabilities security-taxonomy

Updated Sep 19, 2025

praetorian-inc / model-extraction-demo

Star

An application to demonstrate stealing an AI model through knowledge distillation.

security ai model offsec adversarial-ml llm-security

Updated Dec 1, 2025
Python

clolomagico123 / ai-security-lab

Star

🤖 Test and secure AI systems with advanced techniques for Large Language Models, including jailbreaks and automated vulnerability scanners.

incident-response dfir ctf offensive-security blue-team adversarial-attacks ai-security cybersecurity-education hands-on-labs adversarial-ml llm ai-red-team prompt-injection langchain-alternative agentic-ai-security llm-attacks

Updated Feb 8, 2026

deconvolute-labs / benchmarks

Star

Reproducible security benchmarking for the Deconvolute SDK and AI system integrity against adversarial attacks.

benchmark ai-safety adversarial-attacks rag adversarial-ml llm-security deconvolute rag-security indirect-prompt-injection

Updated Feb 1, 2026
Python

donbaudin / meta-ai-bug-bounty

Star

Bug bounty report demonstrating prompt injection and command execution vulnerabilities in Meta AI's Instagram Group Chat

cybersecurity penetration-testing bug-bounty ethical-hacking responsible-disclosure security-research mitre-attack red-teaming ai-security ai-risk adversarial-ml mitre-atlas prompt-injection meta-ai llm-vulnerabilities

Updated May 31, 2025

raghavpoonia / ai-security-mastery

Star

Complete 90-day learning path for AI security: ML fundamentals → LLM internals → AI threats → Detection engineering. Built from first principles with NumPy implementations, Jupyter notebooks, and production-ready detection systems.

machine-learning deep-learning jupyter-notebook owasp pytorch cybersecurity security-research ai-security threat-detection mlops detection-engineering adversarial-ml ai-red-team prompt-injection llm-security

Updated Feb 5, 2026
Jupyter Notebook

tobias1248 / INCITE

Star

Master's students in NCCU SoSLab maintaining a cleaned and restructured version of INCITE (based on PyCT).

cnn transformer mit-license neuronal-network concolic-testing adversarial-ml

Updated Feb 8, 2026
Python

ParraX123 / meta-ai-bug-bounty

Star

🛡️ Discover and analyze critical vulnerabilities in Meta AI's Instagram Group Chat, ensuring robust security through comprehensive testing and reporting.

cybersecurity penetration-testing ethical-hacking responsible-disclosure security-research mitre-attack red-teaming ai-security ai-risk adversarial-ml mitre-atlas prompt-injection meta-ai llm-vulnerabilities

Updated Feb 8, 2026

SecureAI-Team / awesome-aisecurity

Star

A curated list of awesome resources for AI system security.

awesome enhancements good-first-issue ai-security mlsec adversarial-ml llm-security genai-security

Updated Dec 2, 2025

manasa-26 / Adversarial-ML-Scanner

Star

Adversarial ML Scanner for threat detection and ML backdoor attcaks

code-injection adversarial-machine-learning adversarial-attacks threat-detection backdoor-attacks pii-detection ml-backdoors adversarial-ml adversarial-ml-in-security threat-scan adversial-scanner

Updated Feb 18, 2025
Python

bad-antics / mirage

Star

Adversarial Machine Learning Toolkit - Model extraction, adversarial examples, neural network probing, and defense evaluation in Julia

security machine-learning deep-learning julia attacks robustness ai-security adversarial-ml

Updated Jan 31, 2026
Julia

hah23255 / security-vulnerabilities-cli-llm

Star

Security Vulnerabilities and Defensive Mechanisms in CLI/Terminal-Based Large Language Model Deployments - A Comprehensive Research Synthesis (Technical Report, November 2025)

security cybersecurity arxiv research-paper machine-learning-security ai-security adversarial-ml prompt-injection llm-security cli-security

Updated Nov 19, 2025
Rich Text Format

deconvolute-labs / yara-gen

Star

Automatically generate YARA rules from adversarial and benign text samples. Built for detecting indirect prompt injection attacks on RAG pipelines.

yara blue-team ai-security threat-detection rag adversarial-ml prompt-injection llm-security indirect-prompt-injection

Updated Jan 29, 2026
Python

Nathan-Luevano / Shadowroot

Star

An experiment in backdooring a shell safety classifier by planting a hidden trigger in its training data.

python linux ai-safety machine-learning-security backdoor-attacks numpy-implementation data-poisoning adversarial-ml agentic-ai-security shell-command-classifier

Updated Dec 14, 2025
Python

rudra-swnt-12 / llm_court

Star

Autonomous adversarial agents that debate and debug code before you see it.

fastapi groq adversarial-ml langgraph agentic-ai llama-4 gpt-oss-120b gpt-oss-20b

Updated Dec 6, 2025
Python

CassianLee14 / SentinEL-Adversarial-ML

Star

Hybrid Threat Intelligence Engine with Explainable AI (XAI) and Automated Triage.

python machine-learning scikit-learn forensics secops cybersecurity threat-intelligence explainable-ai xai phishing-detection adversarial-ml

Updated Jan 15, 2026
Python

Ashfaaq98 / ai-security-research

Star

A collection of resources documenting my research and learning journey in AI System Security.

research resources ai-security adversarial-ml llm-security agentic-ai ai-red-teaming

Updated Nov 9, 2025

Kravty / ai-safety-radar

Star

Solves AI security research information overload. Autonomous system monitors ArXiv, filters relevant papers, and synthesizes threat intelligence using multi-agent LLM workflow. Features: two-stage filtering, agentic pipeline, forensic logging, air-gapped processing, real-time dashboard.

arxiv multi-agent-systems ai-safety threat-intelligence ai-security steamlit adversarial-ml llm-security langgraph

Updated Jan 18, 2026
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

adversarial-ml

Here are 29 public repositories matching this topic...

depalmar / ai_for_the_win

AmirhosseinHonardoust / Noise-Injection-Techniques

AI-Security-Research-Group / LLM-Attacks

praetorian-inc / model-extraction-demo

clolomagico123 / ai-security-lab

deconvolute-labs / benchmarks

donbaudin / meta-ai-bug-bounty

raghavpoonia / ai-security-mastery

tobias1248 / INCITE

ParraX123 / meta-ai-bug-bounty

SecureAI-Team / awesome-aisecurity

manasa-26 / Adversarial-ML-Scanner

bad-antics / mirage

hah23255 / security-vulnerabilities-cli-llm

deconvolute-labs / yara-gen

Nathan-Luevano / Shadowroot

rudra-swnt-12 / llm_court

CassianLee14 / SentinEL-Adversarial-ML

Ashfaaq98 / ai-security-research

Kravty / ai-safety-radar

Improve this page

Add this topic to your repo