研究組織・研究者の皆様方を対象に、「読売新聞記事データ」「The Japan News記事データ」「日英文対応コーパス」の利用権の販売を行っております。高品質な記事データのご提供を通じて、言語研究・情報学研究・メディア研究など多岐にわたる調査研究をご支援することを目的としています。
大学、公的研究機関の皆様は特別利用価格(アカデミック価格)にて、通常より安価でご購入いただけます。

「読売新聞記事データ」/「The Japan News記事データ」について

1. 年間記事データのご提供本数が膨大

1987年版(販売開始年)は、邦文記事データが8万件でしたが、2022年には約24万件に達しています。地方取材拠点を縮小する社が増える中、読売新聞は全国の取材網を維持しており、1年間に蓄積させる新たな記事データ件数は、他社の約1.5倍という圧倒的な量になります。

2. 1記事データの情報量が膨大

本文情報だけではなく、見出し、キーワード(統制語及び自由語)、分類コードや面種コードなど新聞記事独特の情報を含む書誌情報をご提供します。例えば、自動分類、カテゴリー別の層別化、情報検索用ナビゲーター支援、記事内容に合致した自動索引などの研究などに役立つものです。

3.「ヨミダス用語辞書」によるキーワードの統制

キーワードの統制語は、読売新聞社の専門家(デスク)が別売りの読売新聞「ヨミダス用語辞書」により人手で付与した索引です。多面性を持つ記事内容を的確にとらえた索引ですので、自動処理と人手による処理との比較、自動処理結果の検証などに役立つ有益な情報です。

4. 全国および県版(地域版)での記事データを統合

邦文記事データは全国版のみならず、県版(地域版)の記事も含めてご提供します。地域性のある言語研究や地域間の比較研究など研究目的が拡大できます。各県版(沖縄を除く)の記事データは読売新聞社だけのご提供となります。

5. The Japan News記事データ(英文)との併用

1989年からの英文記事データの利用権を販売しています。英語に関する言語研究や情報学研究などにご利用いただけます。また、邦文記事データと英文記事データを併用することで、日英の比較研究や翻訳ソフト開発などに有効です。英文記事データの販売は読売新聞社だけのご提供となります。

6. 掲載記事件数と販売価格(アカデミック価格)

年(版) 邦文記事 英文記事
記事数 データ容量 価格(税抜)
記事数 データ容量 価格(税抜)
1987年 81,566件 198.39MB 各年
120,000円
1988年 87,000件 211.07MB
1989年 87,635件 208.15MB 465件 3.71MB 各年
110,000円
1990年 93,134件 220.07MB 3,961件 30.37MB
1991年 116,208件 274.11MB 各年
200,000円
4,141件 31.15MB
1992年 121,137件 286.12MB 7,616件 48.72MB 各年
170,000円
1993年 118,957件 284.02MB 11,570件 68.29MB
1994年 121,724件 292.97MB 13,296件 73.26MB
1995年 121,869件 303.14MB 12,672件 68.44MB
1996年 118,983件 300.04MB 10,021件 63.67MB
1997年 121,635件 332.37MB 10,402件 58.20MB
1998年 132,995件 382.01MB 9,676件 50.60MB
1999年 242,985件 697.35MB 各年
270,000円
9,800件 53.48MB
2000年 308,412件 866.95MB 9,082件 52.98MB
2001年 353,880件 934.52MB 8,660件 51.34MB
2002年 370,795件 980.46MB 8,876件 51.96MB
2003年 385,500件 1047.03MB 8,678件 28.59MB
2004年 373,521件 1033.06MB 9,242件 29.91MB
2005年 367,911件 1020.86MB 9,428件 30.30MB
2006年 357,657件 997.65MB 9,130件 29.13MB
2007年 343,142件 977.61MB 9,438件 29.47MB
2008年 333,193件 897.52MB 8,863件 27.65MB
2009年 316,833件 834.07MB 7,380件 23.45MB
2010年 310,750件 813.00MB 5,668件 17.92MB
2011年 313,205件 839.13MB 5,109件 16.42MB
2012年 310,430件 846.85MB 4,878件 14.95MB
2013年 299,821件 829.10MB 5,079件 15.03MB
2014年 281,514件 788.70MB 6,145件 17.72MB
2015年 268,763件 759.93MB 6,507件 19.95MB
2016年 261,079件 745.17MB 5,229件 17.30MB
2017年 263,459件 745.34MB 4,292件 14.81MB
2018年 262,880件 741.87MB 4,160件 14.30MB
2019年 255,883件 751.34MB 3,544件 11.70MB
2020年 255,339件 734.93MB 5,216件 15.94MB
2021年 247,956件 697.76MB 5,621件 16.77MB
2022年 239,654件 669.26MB 5,422件 15.32MB

● アカデミック価格以外の価格につきましては、別途お見積りとなりますのでお問合せください。

 

サンプルはこちらをご覧ください。

日英文対応コーパスについて

「読売新聞記事 日英文対応コーパス」は、「読売新聞」の日本語と「The Japan News」の英語の新聞記事データに対し、記事対応を取り、さらに対応記事内の文対応を取ったものです。 1年単位で利用権を販売しております。

  • 日英の記事をセンテンス単位で対応付け
  • 2006年からの総センテンス数は70万超
  • 2006年版~2022年版まで発売中。
  • アカデミック頒布価格:各年 340,000円(税抜)
    ※その他価格は、別途お見積り
  • コーパスのデータ構築条件はこちらをご覧下さい。
  • 仕様書はこちらをご覧下さい。

販売規定

注意事項

本データは利用権の販売となります。データそのものの販売ではありません。
商用で利用される場合はお問い合わせください。
本データの著作権は読売新聞社が保有しています。
本データは記事検索には使用できません。
本データの改ざんは認められません。
その他、ご質問等ございましたらお問合せください。

 

お問合せはこちら