Scanner deep-dive

GLM-5.1 by Z.ai ↗

General-Purpose LLM · agentic-v1 · scored on 65/66 repositories. Strict scoring (unfinished repos counted as misses).

46.7

F3 (strict)

48.7

F2 (strict)

44.9%

Recall (strict)

73.2%

Precision

65/66

Repos scored

glm-5.1

Model

$33

Total cost

198s

Avg latency

Per-repository breakdown

Each bar shows true positives, false positives, and misses on one repository; bar length is proportional to that repo's labeled vulnerabilities. Ranked by F2.

True positiveFalse positiveMissed (FN)

vfapi96 F2 · 100%

damn-vulnerable-flask-application89 F2 · 91%

python-insecure-app85 F2 · 83%

vulnpy81 F2 · 79%

dsvw76 F2 · 74%

python-app76 F2 · 75%

insecure-web76 F2 · 78%

dvblab73 F2 · 71%

pythonssti70 F2 · 67%

vulnerable-api70 F2 · 67%

vulnerable-tornado-app70 F2 · 69%

vc-kimi-code-seeded-v2-legal-case-django69 F2 · 68%

vc-codex-high-seeded-v2-fintech-lending-fastapi68 F2 · 66%

intentionally-vulnerable-python-application68 F2 · 76%

vc-codex-high-seeded-v2-crm-saas-django67 F2 · 65%

lets-be-bad-guys67 F2 · 62%

owasp-web-playground66 F2 · 65%

dsvpwa66 F2 · 65%

vc-codex-high-seeded-v2-education-lms-django66 F2 · 64%

vulnerable-python-apps66 F2 · 64%

vc-codex-high-seeded-v2-legal-case-django65 F2 · 63%

vc-codex-seeded-v2-logistics-dispatch-fastapi64 F2 · 60%

threatbyte64 F2 · 62%

vc-codex-seeded-v2-marketplace-commerce-fastapi63 F2 · 61%

vulnerable-flask-app62 F2 · 60%

vc-codex-high-seeded-v2-healthcare-clinic-django62 F2 · 60%

dvpwa62 F2 · 61%

vc-kimi-code-seeded-v2-fintech-lending-fastapi60 F2 · 57%

vc-codex-seeded-v2-support-desk-fastapi59 F2 · 54%

vc-codex-seeded-v2-crm-saas-django58 F2 · 56%

vc-codex-high-seeded-v2-hr-payroll-django57 F2 · 55%

vc-kimi-code-seeded-v2-property-management-fastapi57 F2 · 53%

vc-kimi-code-seeded-v2-crm-saas-django57 F2 · 56%

vc-claude-code-seeded-v2-healthcare-clinic-django56 F2 · 53%

pygoat56 F2 · 53%

vc-codex-high-seeded-v2-support-desk-fastapi56 F2 · 52%

vc-codex-seeded-v2-fintech-lending-fastapi55 F2 · 52%

vc-claude-code-seeded-v2-education-lms-django55 F2 · 51%

vc-codex-seeded-v2-legal-case-django54 F2 · 51%

vc-kimi-code-seeded-v2-education-lms-django53 F2 · 54%

vc-claude-code-seeded-v2-hr-payroll-django52 F2 · 49%

vc-claude-code-seeded-v2-property-management-fastapi52 F2 · 48%

vc-kimi-code-seeded-v2-hr-payroll-django52 F2 · 53%

vc-codex-seeded-v2-property-management-fastapi51 F2 · 47%

vc-kimi-code-seeded-v2-healthcare-clinic-django49 F2 · 47%

damn-vulnerable-graphql-application48 F2 · 47%

vc-codex-seeded-v2-hr-payroll-django48 F2 · 44%

vc-codex-seeded-v2-education-lms-django48 F2 · 44%

flask-xss46 F2 · 42%

vc-codex-seeded-v2-healthcare-clinic-django45 F2 · 41%

djangoat38 F2 · 35%

vulpy22 F2 · 19%

vc-claude-code-seeded-v2-crm-saas-django21 F2 · 20%

extremely-vulnerable-flask-app16 F2 · 15%

vc-claude-code-seeded-v2-fintech-lending-fastapi0 F2 · 0%

vc-claude-code-seeded-v2-legal-case-django0 F2 · 0%

vc-claude-code-seeded-v2-logistics-dispatch-fastapi0 F2 · 0%

vc-claude-code-seeded-v2-marketplace-commerce-fastapi0 F2 · 0%

vc-claude-code-seeded-v2-support-desk-fastapi0 F2 · 0%

vc-codex-high-seeded-v2-logistics-dispatch-fastapi0 F2 · 0%

vc-codex-high-seeded-v2-marketplace-commerce-fastapi0 F2 · 0%

vc-codex-high-seeded-v2-property-management-fastapi0 F2 · 0%

vc-kimi-code-seeded-v2-logistics-dispatch-fastapi0 F2 · 0%

vc-kimi-code-seeded-v2-marketplace-commerce-fastapi0 F2 · 0%

vc-kimi-code-seeded-v2-support-desk-fastapi0 F2 · 0%

Repository	TP	FP	FN	Recall %	F2
vfapi	9	2	0	100.0	95.9
damn-vulnerable-flask-application	14	3	1	91.1	88.8
python-insecure-app	7	0	1	83.3	85.4
vulnpy	63	5	17	79.2	81.4
dsvw	20	4	7	74.1	75.7
python-app	16	4	5	74.6	75.7
insecure-web	7	3	2	77.8	75.6
dvblab	16	4	6	71.2	72.6
pythonssti	1	0	1	66.7	70.4
vulnerable-api	9	1	5	66.7	70.3
vulnerable-tornado-app	10	3	4	69.0	70.3
vc-kimi-code-seeded-v2-legal-case-django	18	6	8	68.0	69.1
vc-codex-high-seeded-v2-fintech-lending-fastapi	19	4	10	65.5	68.3
intentionally-vulnerable-python-application	5	6	2	76.2	67.8
vc-codex-high-seeded-v2-crm-saas-django	16	6	9	65.3	66.8
lets-be-bad-guys	15	2	9	62.5	66.6
owasp-web-playground	18	7	10	65.5	66.5
dsvpwa	21	7	11	64.6	66.4
vc-codex-high-seeded-v2-education-lms-django	16	6	9	64.0	65.6
vulnerable-python-apps	14	5	8	63.6	65.5
vc-codex-high-seeded-v2-legal-case-django	16	5	9	62.7	64.8
vc-codex-seeded-v2-logistics-dispatch-fastapi	18	3	12	60.0	64.0
threatbyte	16	5	10	61.5	63.9
vc-codex-seeded-v2-marketplace-commerce-fastapi	18	6	11	60.9	63.4
vulnerable-flask-app	13	5	8	60.3	62.1
vc-codex-high-seeded-v2-healthcare-clinic-django	16	6	10	60.2	62.1
dvpwa	14	8	9	60.9	61.5
vc-kimi-code-seeded-v2-fintech-lending-fastapi	19	6	14	56.6	59.7
vc-codex-seeded-v2-support-desk-fastapi	16	3	14	54.4	58.6
vc-codex-seeded-v2-crm-saas-django	19	7	15	55.9	58.5
vc-codex-high-seeded-v2-hr-payroll-django	14	5	11	54.7	57.4
vc-kimi-code-seeded-v2-property-management-fastapi	16	5	14	53.3	56.9
vc-kimi-code-seeded-v2-crm-saas-django	15	9	12	55.6	56.7
vc-claude-code-seeded-v2-healthcare-clinic-django	15	5	14	52.9	56.2
pygoat	42	21	36	53.4	55.6
vc-codex-high-seeded-v2-support-desk-fastapi	15	5	13	52.4	55.6
vc-codex-seeded-v2-fintech-lending-fastapi	19	7	18	52.2	55.3
vc-claude-code-seeded-v2-education-lms-django	16	5	16	51.0	54.7
vc-codex-seeded-v2-legal-case-django	17	4	16	50.5	54.5
vc-kimi-code-seeded-v2-education-lms-django	15	15	13	53.6	52.7
vc-claude-code-seeded-v2-hr-payroll-django	13	6	14	49.4	52.5
vc-claude-code-seeded-v2-property-management-fastapi	16	5	17	48.5	52.2
vc-kimi-code-seeded-v2-hr-payroll-django	15	16	14	52.9	52.0
vc-codex-seeded-v2-property-management-fastapi	15	4	16	47.3	51.4
vc-kimi-code-seeded-v2-healthcare-clinic-django	14	8	16	46.7	49.2
damn-vulnerable-graphql-application	17	16	19	47.2	48.0
vc-codex-seeded-v2-hr-payroll-django	17	7	22	44.4	48.0
vc-codex-seeded-v2-education-lms-django	15	6	20	43.8	47.5
flask-xss	13	5	17	42.2	46.1
vc-codex-seeded-v2-healthcare-clinic-django	17	7	24	41.5	45.3
djangoat	18	12	34	34.6	37.8
vulpy	11	5	46	19.3	21.8
vc-claude-code-seeded-v2-crm-saas-django	6	2	22	20.2	21.0
extremely-vulnerable-flask-app	5	1	27	14.6	16.2
vc-claude-code-seeded-v2-fintech-lending-fastapi	0	0	29	0.0	0.0
vc-claude-code-seeded-v2-legal-case-django	0	0	31	0.0	0.0
vc-claude-code-seeded-v2-logistics-dispatch-fastapi	0	0	33	0.0	0.0
vc-claude-code-seeded-v2-marketplace-commerce-fastapi	0	0	32	0.0	0.0
vc-claude-code-seeded-v2-support-desk-fastapi	0	0	34	0.0	0.0
vc-codex-high-seeded-v2-logistics-dispatch-fastapi	0	0	29	0.0	0.0
vc-codex-high-seeded-v2-marketplace-commerce-fastapi	0	0	25	0.0	0.0
vc-codex-high-seeded-v2-property-management-fastapi	0	0	26	0.0	0.0
vc-kimi-code-seeded-v2-logistics-dispatch-fastapi	0	0	31	0.0	0.0
vc-kimi-code-seeded-v2-marketplace-commerce-fastapi	0	0	27	0.0	0.0
vc-kimi-code-seeded-v2-support-desk-fastapi	0	0	28	0.0	0.0

Detection by severity

Severity	TP	FP	FN	Recall %
Critical	129	0	25	83.8
High	363	3	383	48.7
Medium	335	2	569	37.1
Low	36	0	48	42.9

Detection by vulnerability class

CWE family	TP	FP	FN	Recall %
HTTP Header Injection	2	0	0	100.0
XPath Injection	4	0	0	100.0
Code Injection / RFI	29	0	5	85.3
SQL Injection	64	0	13	83.1
Insecure Deserialization	33	0	7	82.5
Command / OS Injection	40	0	10	80.0
Path Traversal	35	1	9	79.5
XML External Entities	29	1	9	76.3
Open Redirect	30	0	10	75.0
Server-Side Request Forgery	27	1	14	65.9
Hardcoded Credentials	42	0	25	62.7
Cross-Site Scripting	65	2	45	59.1
Security Misconfiguration	53	0	59	47.3
Sensitive Data Exposure	61	0	92	39.9
Missing Authentication / Authorization	31	0	50	38.3
Other	288	0	583	33.1
Broken Access Control / IDOR	22	0	59	27.2
Denial of Service	8	0	35	18.6

LLM operational metrics

45,953

Avg input tokens

9,681

Avg output tokens

174,480

Avg total tokens

198s

Avg latency / repo

19.7%

JSON repair rate

198

Total runs

±26.4

F2 run-to-run σ

Cost

$33

Total cost

$0.17

Cost / run

$0.008

Cost / 100 LOC

133,330

Python LOC scanned

195

Successful runs

← Back to the leaderboard