面向金融研究、量化建模与舆情分析场景,我们构建了覆盖近 30 年《华尔街日报》(Wall Street Journal) 的全量文章归档与结构化数据服务,按年度打包、按月度组织,支持多字段检索与定制化交付。
按年度分卷打包,每卷内按月切分为独立 CSV,便于增量更新与按需交付。
每条记录包含 9 个核心字段,覆盖文章标识、内容、分类与时间维度,支持精准筛选与全文检索。
| 字段 | 说明 | 示例 |
|---|---|---|
url |
文章原始链接 | https://www.wsj.com/articles/new-coronavirus-outbreak-... |
title |
文章标题 | New Coronavirus Outbreak Prompts New Zealand to Postpone Election |
headLine |
副标题 / 摘要 | Prime Minister Jacinda Ardern … |
section |
所属板块 | World · US · Politics · Opinion · Business · Markets · Economy · Life · Tech · Arts |
category |
细分分类 | World News · Europe News · Middle East · Obituaries · Election · Heard on the Street · Commentary · Review & Outlook · Tennis · MLB … |
content |
文章正文 | WELLINGTON — New Zealand's prime minister … |
author |
作者 | Stephen Wright / WSJ Staff |
date |
发布日期 | 2020-08-16 |
timeTag |
精确时间戳 (UTC) | 2020-08-16T03:53:00Z |
节选自 2020-09.csv 真实记录,展示跨板块的时间分布与结构化字段组合。
| date | timeTag | section | category | author |
|---|---|---|---|---|
| 2020-09-06 | 03:07:00Z | World | Obituaries | Associated Press |
| 2020-09-06 | 01:17:00Z | Politics | Politics & Policy | Rebecca Davis |
| 2020-09-06 | 23:26:00Z | Life | Tennis | Jason Gay |
| 2020-09-06 | 20:37:00Z | World | Middle East | Raja Abdulrahim |
| 2020-09-06 | 19:00:00Z | Economy | Economy Week | WSJ Staff |
| 2020-09-06 | 14:23:00Z | Life | MLB | Louise Radnofsky |
| 2020-09-06 | 14:03:00Z | Markets | Heard on the Street | Jinjoo Lee |
| 2020-09-06 | 11:00:00Z | World | World News | Mike Cherney |
| 2020-09-06 | 09:30:00Z | Business | Business | Anne Steele |
| 2020-09-07 | 23:05:00Z | Politics | Election 2020 | Catherine Lucey |
| 2020-09-07 | 22:44:00Z | Opinion | Review & Outlook | The Editorial Board |
| 2020-09-06 | 06:43:00Z | Tech | Technology | Dan Strumpf |
覆盖 WSJ 全部主流板块与数十个细分分类,满足多场景筛选需求。以下为 section → category 的典型映射。
构建事件研究 (Event Study) 语料库,回溯重大财经事件对市场情绪与资产价格的影响。
基于 section / category / author 多维过滤,结合正文全文检索,快速聚合主题与观点。
结构规范、时间跨度长的高质量财经语料,适用于行业大模型微调、摘要与分类任务训练。
按时间切片或主题筛选的可追溯引用源,服务于高校、智库与咨询机构的长期研究。
无论是数据需求、系统定制还是行业合作,欢迎通过企业微信或邮箱与我们交流。