StructuredDataに関する論文・技術記事メモの一覧

StructuredData

Struc-Bench: Are Large Language Models Really Good at Generating Complex Structured Data?, Xiangru Tang+, N_A, arXiv'23

Paper/Blog Link My Issue
#NLP #Dataset #LanguageModel #One-Line Notes Issue Date: 2023-09-30 GPT Summary- 本研究では、大規模言語モデル（LLMs）の能力を評価し、構造に注意したファインチューニング手法を提案します。さらに、Struc-Benchというデータセットを使用して、複雑な構造化データ生成のパフォーマンスを評価します。実験の結果、提案手法は他の評価されたLLMsよりも優れた性能を示しました。また、モデルの能力マップを提示し、LLMsの弱点と将来の研究の方向性を示唆しています。詳細はhttps://github.com/gersteinlab/Struc-Benchを参照してください。 Comment

Formatに関する情報を含むデータでInstruction TuningすることでFormatCoT（フォーマットに関する情報のCoT）を実現している模様。ざっくりしか論文を読んでいないが詳細な情報があまり書かれていない印象で、ちょっとなんともいえない。

MURMUR: Modular Multi-Step Reasoning for Semi-Structured Data-to-Text Generation, Swarnadeep Saha+, N_A, arXiv'22

Paper/Blog Link My Issue
#NaturalLanguageGeneration #NLP #DataToTextGeneration Issue Date: 2023-10-28 GPT Summary- 本研究では、半構造化データからのテキスト生成における多段階の推論を行うためのMURMURという手法を提案しています。MURMURは、特定の言語的および論理的なスキルを持つニューラルモジュールと記号モジュールを組み合わせ、ベストファーストサーチ手法を使用して推論パスを生成します。実験結果では、MURMURは他のベースライン手法に比べて大幅な改善を示し、また、ドメイン外のデータでも同等の性能を達成しました。さらに、人間の評価では、MURMURは論理的に整合性のある要約をより多く生成することが示されました。

dots.ocr-1.5, rednote-hilab, 2026.02

Paper/Blog Link My Issue
#Article #ComputerVision #NLP #MultiModal #SmallModel #OpenWeight #DocParser #OCR Issue Date: 2026-02-16 Comment

元ポスト:

Loading…

LimiX: Unleashing the modeling power of structured data, LimiX team （Stability AI & Tsinghua University）, 2025.09

Paper/Blog Link My Issue
#Article #FoundationModel Issue Date: 2025-09-02 Comment

元ポスト:

Loading…

large structured-data model (LDM)と呼ばれる構造化データに対する基盤モデルな模様

Structured Outputs OpenAI Platform, 2025.01

Paper/Blog Link My Issue
#Article #LanguageModel #Chain-of-Thought #python #One-Line Notes Issue Date: 2025-01-25 Comment

pydanticを用いて、CoT＋構造化されたoutputを実施するサンプル