わたしのべんきょうノート

勉強した論文や技術等の情報をGithubのIssueにメモっているひとのブログ。それなりにメモの量が蓄積されてきたので、一度整理したいなと思いブログはじめてみました！自然言語処理(NLP), 推薦システム(RecommenderSystem), Educational Data Mining (EDM), Learning Analytics (LA)などの分野のメモが多いと思います。最近は特にLLMの勉強が多めです :)

Oct 31, 2025 AkihikoWATANABE About 2 mins

Light

Dark

Security

Introducing Aardvark: OpenAI’s agentic security researcher, OpenAI, 2025.10

Paper/Blog Link My Issue
#Article #NLP #LanguageModel #AIAgents #One-Line Notes Issue Date: 2025-10-31 Comment

元ポスト:

Loading…

> In benchmark testing on “golden” repositories, Aardvark identified 92% of known and synthetically-introduced vulnerabilities, demonstrating high recall and real-world effectiveness.

合成された脆弱性については92%程度検出できたとのこと。Claudeとかだとこの辺はどの程度の性能なのだろう。