わたしのべんきょうノート

勉強した論文や技術等の情報をGithubのIssueにメモっているひとのブログ。それなりにメモの量が蓄積されてきたので、一度整理したいなと思いブログはじめてみました！自然言語処理(NLP), 推薦システム(RecommenderSystem), Educational Data Mining (EDM), Learning Analytics (LA)などの分野のメモが多いと思います。最近は特にLLMの勉強が多めです :)

Aug 22, 2025 AkihikoWATANABE About 1 min

Light

Dark

ACMMM

[Paper Note] DiT: Self-supervised Pre-training for Document Image Transformer, Junlong Li+, ACMMM'22

Paper/Blog Link My Issue
#ComputerVision #Transformer #OCR #Backbone Issue Date: 2025-08-22 GPT Summary- 自己監視型事前学習モデルDiTを提案し、ラベルなしテキスト画像を用いて文書AIタスクにおける性能を向上。文書画像分類やレイアウト分析、表検出、OCRなどで新たな最先端結果を達成。コードとモデルは公開中。