WebsitearXivPDF

Data Journalist Agent — 把数据变成可审计的多媒体故事

这篇论文提出 Data2Story,一个“虚拟 newsroom”式的多智能体系统。它的目标不是只回答一个数据问题,而是从原始数据出发,完成找背景、跑统计、选故事角度、设计多媒体素材、生成网页、检查页面、绑定证据链,最后产出一篇普通读者能读完、也能追溯证据的数据新闻文章。论文最重要的点不是“AI 写新闻”,而是把可验证性做成产物的一部分。

背景铺垫

问题是什么

核心想法

Raw data

CSV / table / source files
输入
结构化数据和少量任务上下文
风险
数据本身通常没有故事角度
newsroom

Specialist agents

search, analysis, edit, design
工作
查背景、跑代码、选角度、做素材
约束
中间结果都要能追踪
publish

Auditable story

interactive HTML article
输出
多媒体网页和 Inspector 证据链
目标
能读、能查、能复核

方法怎么做

Evidence producers

Detective + Analyst
一个找外部语境,一个跑可执行统计,负责给故事提供可验证材料。

Story builders

Editor + Designer + Programmer
决定文章讲什么、怎么展示,并生成真正能交互的网页。

Quality guards

Auditor + Inspector
一个修页面质量,一个建立证据链,让文章既好看又可审计。

新意在哪里

普通生成文章

looks plausible
读起来像新闻,但数字、图表和背景 claim 很难逐条追溯。

Data2Story

looks + checks
每个重要片段都有上游证据:数据、脚本行、分析结果、素材调用或外部 URL。

结果速览

局限与开放问题

影响