Scanner deep-dive

GLM-5 by Z.ai ↗

General-Purpose LLM · agentic-v1 · scored on 62/66 repositories. Strict scoring (unfinished repos counted as misses).

34.6

F3 (strict)

36.9

F2 (strict)

32.6%

Recall (strict)

77.3%

Precision

62/66

Repos scored

glm-5

Model

$14

Total cost

155s

Avg latency

Per-repository breakdown

Each bar shows true positives, false positives, and misses on one repository; bar length is proportional to that repo's labeled vulnerabilities. Ranked by F2.

True positiveFalse positiveMissed (FN)

vfapi74 F2 · 89%

damn-vulnerable-flask-application70 F2 · 69%

dsvw67 F2 · 64%

insecure-web66 F2 · 70%

python-app65 F2 · 62%

intentionally-vulnerable-python-application64 F2 · 62%

vulnerable-flask-app62 F2 · 60%

vc-codex-high-seeded-v2-crm-saas-django62 F2 · 57%

lets-be-bad-guys61 F2 · 58%

dvblab60 F2 · 56%

vulnerable-api59 F2 · 55%

dsvpwa59 F2 · 54%

vc-codex-high-seeded-v2-education-lms-django58 F2 · 55%

vc-kimi-code-seeded-v2-legal-case-django58 F2 · 54%

vc-codex-high-seeded-v2-hr-payroll-django56 F2 · 51%

vc-codex-high-seeded-v2-healthcare-clinic-django55 F2 · 50%

python-insecure-app54 F2 · 50%

pythonssti54 F2 · 50%

vc-codex-seeded-v2-logistics-dispatch-fastapi53 F2 · 48%

owasp-web-playground53 F2 · 49%

vc-kimi-code-seeded-v2-crm-saas-django52 F2 · 48%

vc-claude-code-seeded-v2-hr-payroll-django52 F2 · 47%

vc-kimi-code-seeded-v2-property-management-fastapi51 F2 · 47%

vc-codex-high-seeded-v2-support-desk-fastapi51 F2 · 46%

vc-codex-high-seeded-v2-legal-case-django51 F2 · 47%

vc-codex-high-seeded-v2-fintech-lending-fastapi49 F2 · 45%

vc-kimi-code-seeded-v2-education-lms-django49 F2 · 45%

vc-codex-seeded-v2-crm-saas-django48 F2 · 44%

threatbyte48 F2 · 45%

vc-kimi-code-seeded-v2-fintech-lending-fastapi48 F2 · 43%

vc-codex-seeded-v2-property-management-fastapi47 F2 · 42%

vc-kimi-code-seeded-v2-healthcare-clinic-django47 F2 · 42%

vc-codex-seeded-v2-legal-case-django47 F2 · 41%

vulnerable-python-apps46 F2 · 42%

pygoat46 F2 · 43%

vc-codex-seeded-v2-fintech-lending-fastapi45 F2 · 41%

vc-codex-seeded-v2-hr-payroll-django45 F2 · 40%

vc-kimi-code-seeded-v2-hr-payroll-django44 F2 · 41%

extremely-vulnerable-flask-app44 F2 · 40%

vc-codex-seeded-v2-support-desk-fastapi42 F2 · 38%

vc-claude-code-seeded-v2-healthcare-clinic-django41 F2 · 37%

vc-codex-seeded-v2-marketplace-commerce-fastapi41 F2 · 37%

vc-claude-code-seeded-v2-property-management-fastapi40 F2 · 35%

vc-claude-code-seeded-v2-education-lms-django40 F2 · 35%

vc-codex-seeded-v2-education-lms-django39 F2 · 35%

damn-vulnerable-graphql-application39 F2 · 36%

dvpwa38 F2 · 35%

flask-xss37 F2 · 33%

vc-codex-seeded-v2-healthcare-clinic-django36 F2 · 32%

djangoat35 F2 · 31%

vc-claude-code-seeded-v2-crm-saas-django0 F2 · 0%

vc-claude-code-seeded-v2-fintech-lending-fastapi0 F2 · 0%

vc-claude-code-seeded-v2-legal-case-django0 F2 · 0%

vc-claude-code-seeded-v2-logistics-dispatch-fastapi0 F2 · 0%

vc-claude-code-seeded-v2-marketplace-commerce-fastapi0 F2 · 0%

vc-claude-code-seeded-v2-support-desk-fastapi0 F2 · 0%

vc-codex-high-seeded-v2-logistics-dispatch-fastapi0 F2 · 0%

vc-codex-high-seeded-v2-marketplace-commerce-fastapi0 F2 · 0%

vc-codex-high-seeded-v2-property-management-fastapi0 F2 · 0%

vc-kimi-code-seeded-v2-logistics-dispatch-fastapi0 F2 · 0%

vc-kimi-code-seeded-v2-marketplace-commerce-fastapi0 F2 · 0%

vc-kimi-code-seeded-v2-support-desk-fastapi0 F2 · 0%

Repository	TP	FP	FN	Recall %	F2
vfapi	8	10	1	88.9	74.1
damn-vulnerable-flask-application	10	3	5	68.9	70.1
dsvw	17	4	10	64.2	66.8
insecure-web	6	5	3	70.4	66.4
python-app	13	2	8	61.9	65.4
intentionally-vulnerable-python-application	4	1	3	61.9	64.3
vulnerable-flask-app	13	6	8	60.3	61.9
vc-codex-high-seeded-v2-crm-saas-django	14	2	11	57.3	61.6
lets-be-bad-guys	14	4	10	58.3	61.3
dvblab	12	2	10	56.1	60.2
vulnerable-api	8	1	6	54.8	59.0
dsvpwa	17	2	15	54.2	58.7
vc-codex-high-seeded-v2-education-lms-django	14	5	11	54.7	57.7
vc-kimi-code-seeded-v2-legal-case-django	14	4	12	53.8	57.6
vc-codex-high-seeded-v2-hr-payroll-django	13	1	12	50.7	55.5
vc-codex-high-seeded-v2-healthcare-clinic-django	13	2	13	50.0	54.8
python-insecure-app	4	1	4	50.0	54.4
pythonssti	1	0	1	50.0	53.7
vc-codex-seeded-v2-logistics-dispatch-fastapi	14	1	16	47.8	52.8
owasp-web-playground	14	4	14	48.8	52.7
vc-kimi-code-seeded-v2-crm-saas-django	13	4	14	48.1	52.0
vc-claude-code-seeded-v2-hr-payroll-django	13	1	14	46.9	51.9
vc-kimi-code-seeded-v2-property-management-fastapi	14	2	16	46.7	51.4
vc-codex-high-seeded-v2-support-desk-fastapi	13	2	15	46.4	51.2
vc-codex-high-seeded-v2-legal-case-django	12	3	13	46.7	51.0
vc-codex-high-seeded-v2-fintech-lending-fastapi	13	3	16	44.8	49.3
vc-kimi-code-seeded-v2-education-lms-django	13	5	15	45.2	48.7
vc-codex-seeded-v2-crm-saas-django	15	3	19	44.1	48.5
threatbyte	12	6	14	44.9	47.9
vc-kimi-code-seeded-v2-fintech-lending-fastapi	14	4	19	43.4	47.7
vc-codex-seeded-v2-property-management-fastapi	13	2	18	41.9	46.7
vc-kimi-code-seeded-v2-healthcare-clinic-django	13	3	17	42.2	46.7
vc-codex-seeded-v2-legal-case-django	14	1	19	41.4	46.6
vulnerable-python-apps	9	4	13	42.4	45.8
pygoat	33	20	45	42.7	45.7
vc-codex-seeded-v2-fintech-lending-fastapi	15	2	22	40.5	45.3
vc-codex-seeded-v2-hr-payroll-django	16	4	23	40.2	44.7
vc-kimi-code-seeded-v2-hr-payroll-django	12	7	17	41.4	44.4
extremely-vulnerable-flask-app	13	2	19	39.6	44.3
vc-codex-seeded-v2-support-desk-fastapi	11	4	19	37.8	41.8
vc-claude-code-seeded-v2-healthcare-clinic-django	11	2	18	36.8	41.4
vc-codex-seeded-v2-marketplace-commerce-fastapi	11	2	18	36.8	41.3
vc-claude-code-seeded-v2-property-management-fastapi	12	1	21	35.4	40.4
vc-claude-code-seeded-v2-education-lms-django	11	2	21	35.4	39.9
vc-codex-seeded-v2-education-lms-django	12	4	23	35.2	39.3
damn-vulnerable-graphql-application	13	8	23	36.1	39.2
dvpwa	8	6	15	34.8	37.6
flask-xss	10	6	20	33.3	36.8
vc-codex-seeded-v2-healthcare-clinic-django	13	2	28	31.7	36.4
djangoat	16	7	36	30.8	34.6
vc-claude-code-seeded-v2-crm-saas-django	0	0	28	0.0	0.0
vc-claude-code-seeded-v2-fintech-lending-fastapi	0	0	29	0.0	0.0
vc-claude-code-seeded-v2-legal-case-django	0	0	31	0.0	0.0
vc-claude-code-seeded-v2-logistics-dispatch-fastapi	0	0	33	0.0	0.0
vc-claude-code-seeded-v2-marketplace-commerce-fastapi	0	0	32	0.0	0.0
vc-claude-code-seeded-v2-support-desk-fastapi	0	0	34	0.0	0.0
vc-codex-high-seeded-v2-logistics-dispatch-fastapi	0	0	29	0.0	0.0
vc-codex-high-seeded-v2-marketplace-commerce-fastapi	0	0	25	0.0	0.0
vc-codex-high-seeded-v2-property-management-fastapi	0	0	26	0.0	0.0
vc-kimi-code-seeded-v2-logistics-dispatch-fastapi	0	0	31	0.0	0.0
vc-kimi-code-seeded-v2-marketplace-commerce-fastapi	0	0	27	0.0	0.0
vc-kimi-code-seeded-v2-support-desk-fastapi	0	0	28	0.0	0.0

Detection by severity

Severity	TP	FP	FN	Recall %
Critical	105	0	34	75.5
High	268	0	428	38.5
Medium	233	1	606	27.8
Low	9	0	54	14.3

Detection by vulnerability class

CWE family	TP	FP	FN	Recall %
HTTP Header Injection	2	0	0	100.0
XPath Injection	1	0	0	100.0
Code Injection / RFI	26	0	5	83.9
Insecure Deserialization	29	0	7	80.6
SQL Injection	52	0	15	77.6
Command / OS Injection	33	0	11	75.0
Open Redirect	29	0	11	72.5
XML External Entities	24	0	11	68.6
Server-Side Request Forgery	19	0	9	67.9
Path Traversal	19	0	13	59.4
Hardcoded Credentials	27	0	31	46.6
Cross-Site Scripting	35	0	58	37.6
Security Misconfiguration	37	0	70	34.6
Missing Authentication / Authorization	26	1	52	33.3
Other	208	0	626	24.9
Sensitive Data Exposure	30	0	115	20.7
Broken Access Control / IDOR	15	0	64	19.0
Denial of Service	3	0	24	11.1

LLM operational metrics

24,464

Avg input tokens

4,264

Avg output tokens

162,686

Avg total tokens

155s

Avg latency / repo

18.2%

JSON repair rate

198

Total runs

±22.0

F2 run-to-run σ

Cost

$14

Total cost

$0.07

Cost / run

$0.004

Cost / 100 LOC

129,077

Python LOC scanned

186

Successful runs

← Back to the leaderboard