Scanner deep-dive

Minimax M2.7 by MiniMax ↗

General-Purpose LLM · agentic-v1 · scored on 61/66 repositories. Strict scoring (unfinished repos counted as misses).

29.7

F3 (strict)

31.6

F2 (strict)

28.0%

Recall (strict)

64.5%

Precision

61/66

Repos scored

MiniMax-M2.7

Model

Total cost

161s

Avg latency

Per-repository breakdown

Each bar shows true positives, false positives, and misses on one repository; bar length is proportional to that repo's labeled vulnerabilities. Ranked by F2.

True positiveFalse positiveMissed (FN)

insecure-web67 F2 · 63%

vfapi63 F2 · 67%

vulnerable-api63 F2 · 60%

vampi62 F2 · 62%

intentionally-vulnerable-python-application61 F2 · 57%

vulnpy59 F2 · 55%

dsvw59 F2 · 54%

dvblab57 F2 · 53%

pythonssti56 F2 · 50%

vc-codex-high-seeded-v2-crm-saas-django53 F2 · 48%

vulnerable-tornado-app50 F2 · 45%

vulnerable-python-apps47 F2 · 45%

python-app46 F2 · 43%

vc-codex-high-seeded-v2-property-management-fastapi45 F2 · 42%

owasp-web-playground44 F2 · 43%

lets-be-bad-guys44 F2 · 40%

vc-codex-high-seeded-v2-healthcare-clinic-django44 F2 · 38%

dsvpwa42 F2 · 38%

python-insecure-app42 F2 · 38%

vc-codex-high-seeded-v2-marketplace-commerce-fastapi41 F2 · 37%

vc-codex-high-seeded-v2-legal-case-django41 F2 · 36%

vc-kimi-code-seeded-v2-crm-saas-django41 F2 · 37%

vc-codex-seeded-v2-logistics-dispatch-fastapi40 F2 · 35%

vc-codex-high-seeded-v2-support-desk-fastapi38 F2 · 35%

vulpy38 F2 · 33%

pygoat38 F2 · 34%

damn-vulnerable-flask-application37 F2 · 33%

vc-codex-high-seeded-v2-fintech-lending-fastapi37 F2 · 34%

vc-kimi-code-seeded-v2-education-lms-django37 F2 · 33%

threatbyte37 F2 · 33%

vc-kimi-code-seeded-v2-logistics-dispatch-fastapi36 F2 · 32%

vc-codex-seeded-v2-fintech-lending-fastapi35 F2 · 31%

vc-codex-high-seeded-v2-education-lms-django35 F2 · 32%

vulnerable-flask-app34 F2 · 32%

flask-xss34 F2 · 30%

vc-codex-seeded-v2-property-management-fastapi34 F2 · 30%

vc-codex-seeded-v2-healthcare-clinic-django33 F2 · 29%

extremely-vulnerable-flask-app33 F2 · 29%

vc-claude-code-seeded-v2-education-lms-django32 F2 · 29%

vc-codex-seeded-v2-hr-payroll-django32 F2 · 28%

vc-codex-seeded-v2-crm-saas-django31 F2 · 27%

vc-claude-code-seeded-v2-logistics-dispatch-fastapi31 F2 · 27%

vc-kimi-code-seeded-v2-healthcare-clinic-django31 F2 · 27%

vc-codex-seeded-v2-marketplace-commerce-fastapi30 F2 · 28%

vc-kimi-code-seeded-v2-support-desk-fastapi30 F2 · 26%

dvpwa29 F2 · 26%

vc-claude-code-seeded-v2-fintech-lending-fastapi29 F2 · 26%

djangoat28 F2 · 24%

vc-codex-seeded-v2-education-lms-django27 F2 · 25%

damn-vulnerable-graphql-application21 F2 · 19%

vc-claude-code-seeded-v2-support-desk-fastapi21 F2 · 19%

vc-claude-code-seeded-v2-hr-payroll-django21 F2 · 19%

vc-codex-seeded-v2-legal-case-django17 F2 · 15%

vc-codex-seeded-v2-support-desk-fastapi17 F2 · 14%

vc-kimi-code-seeded-v2-marketplace-commerce-fastapi12 F2 · 11%

vc-claude-code-seeded-v2-crm-saas-django9 F2 · 7%

vc-claude-code-seeded-v2-healthcare-clinic-django6 F2 · 5%

vc-kimi-code-seeded-v2-hr-payroll-django4 F2 · 3%

vc-claude-code-seeded-v2-marketplace-commerce-fastapi0 F2 · 0%

vc-claude-code-seeded-v2-property-management-fastapi0 F2 · 0%

vc-kimi-code-seeded-v2-property-management-fastapi0 F2 · 0%

Repository	TP	FP	FN	Recall %	F2
insecure-web	6	0	3	63.0	67.4
vfapi	6	6	3	66.7	62.9
vulnerable-api	8	2	6	59.5	62.8
vampi	9	7	6	62.2	61.7
intentionally-vulnerable-python-application	4	1	3	57.1	61.2
vulnpy	44	6	36	55.0	59.4
dsvw	15	2	12	54.3	58.9
dvblab	12	2	10	53.0	57.4
pythonssti	1	0	1	50.0	55.6
vc-codex-high-seeded-v2-crm-saas-django	12	2	13	48.0	52.9
vulnerable-tornado-app	6	2	8	45.2	49.6
vulnerable-python-apps	10	6	12	45.5	47.1
python-app	9	4	12	42.9	46.4
vc-codex-high-seeded-v2-property-management-fastapi	11	6	15	42.3	45.4
owasp-web-playground	12	11	16	42.9	44.4
lets-be-bad-guys	10	5	14	40.3	43.6
vc-codex-high-seeded-v2-healthcare-clinic-django	10	1	16	38.5	43.5
dsvpwa	12	3	20	37.5	42.0
python-insecure-app	3	1	5	37.5	41.5
vc-codex-high-seeded-v2-marketplace-commerce-fastapi	9	3	16	37.3	41.4
vc-codex-high-seeded-v2-legal-case-django	9	0	16	36.0	41.3
vc-kimi-code-seeded-v2-crm-saas-django	10	4	17	37.0	40.8
vc-codex-seeded-v2-logistics-dispatch-fastapi	10	2	20	35.0	39.6
vc-codex-high-seeded-v2-support-desk-fastapi	10	4	18	34.5	38.4
vulpy	19	3	38	33.3	38.0
pygoat	26	12	52	33.8	37.5
damn-vulnerable-flask-application	5	2	10	33.3	37.4
vc-codex-high-seeded-v2-fintech-lending-fastapi	10	8	19	34.5	37.4
vc-kimi-code-seeded-v2-education-lms-django	9	4	19	33.3	37.3
threatbyte	9	5	17	33.3	36.8
vc-kimi-code-seeded-v2-logistics-dispatch-fastapi	10	5	21	32.3	36.0
vc-codex-seeded-v2-fintech-lending-fastapi	11	3	26	30.6	34.9
vc-codex-high-seeded-v2-education-lms-django	8	7	17	32.0	34.8
vulnerable-flask-app	7	7	14	31.8	34.0
flask-xss	9	3	21	30.0	33.9
vc-codex-seeded-v2-property-management-fastapi	9	4	22	30.1	33.9
vc-codex-seeded-v2-healthcare-clinic-django	12	4	29	29.3	33.3
extremely-vulnerable-flask-app	9	3	23	29.2	33.1
vc-claude-code-seeded-v2-education-lms-django	9	7	23	29.2	32.4
vc-codex-seeded-v2-hr-payroll-django	11	3	28	28.2	32.4
vc-codex-seeded-v2-crm-saas-django	9	4	25	27.5	31.3
vc-claude-code-seeded-v2-logistics-dispatch-fastapi	9	4	24	27.3	31.0
vc-kimi-code-seeded-v2-healthcare-clinic-django	8	1	22	26.7	31.0
vc-codex-seeded-v2-marketplace-commerce-fastapi	8	7	21	27.6	30.5
vc-kimi-code-seeded-v2-support-desk-fastapi	7	5	21	26.2	29.5
dvpwa	6	3	17	26.1	29.0
vc-claude-code-seeded-v2-fintech-lending-fastapi	8	9	21	26.4	28.7
djangoat	13	8	39	24.4	27.6
vc-codex-seeded-v2-education-lms-django	9	9	26	24.8	27.4
damn-vulnerable-graphql-application	7	5	29	19.4	21.4
vc-claude-code-seeded-v2-support-desk-fastapi	6	5	28	18.6	21.4
vc-claude-code-seeded-v2-hr-payroll-django	5	2	22	18.5	21.0
vc-codex-seeded-v2-legal-case-django	5	3	28	15.2	16.9
vc-codex-seeded-v2-support-desk-fastapi	4	6	26	14.4	16.6
vc-kimi-code-seeded-v2-marketplace-commerce-fastapi	3	10	24	11.1	12.0
vc-claude-code-seeded-v2-crm-saas-django	2	2	26	7.1	8.6
vc-claude-code-seeded-v2-healthcare-clinic-django	2	3	28	5.2	6.2
vc-kimi-code-seeded-v2-hr-payroll-django	1	6	28	3.5	4.1
vc-claude-code-seeded-v2-marketplace-commerce-fastapi	0	9	32	0.0	0.0
vc-claude-code-seeded-v2-property-management-fastapi	0	13	33	0.0	0.0
vc-kimi-code-seeded-v2-property-management-fastapi	0	19	30	0.0	0.0

Detection by severity

Severity	TP	FP	FN	Recall %
Critical	103	0	44	70.1
High	239	7	453	34.5
Medium	164	10	674	19.6
Low	13	0	69	15.9

Detection by vulnerability class

CWE family	TP	FP	FN	Recall %
HTTP Header Injection	2	0	0	100.0
XPath Injection	4	0	0	100.0
Insecure Deserialization	29	0	7	80.6
Code Injection / RFI	23	0	6	79.3
XML External Entities	26	1	7	78.8
SQL Injection	56	2	17	76.7
Command / OS Injection	36	0	11	76.6
Path Traversal	26	3	16	61.9
Open Redirect	22	1	14	61.1
Server-Side Request Forgery	22	1	17	56.4
Hardcoded Credentials	31	0	37	45.6
Cross-Site Scripting	46	2	61	43.0
Broken Access Control / IDOR	15	0	60	20.0
Other	131	0	674	16.3
Security Misconfiguration	15	0	85	15.0
Denial of Service	6	0	36	14.3
Missing Authentication / Authorization	11	7	68	13.9
Sensitive Data Exposure	18	0	124	12.7

LLM operational metrics

104,466

Avg input tokens

5,546

Avg output tokens

145,833

Avg total tokens

161s

Avg latency / repo

0.0%

JSON repair rate

198

Total runs

±16.2

F2 run-to-run σ

Cost

Total cost

$0.06

Cost / run

$0.003

Cost / 100 LOC

116,141

Python LOC scanned

136

Successful runs

← Back to the leaderboard