もっと詳しく

>国立国会図書館は、帝国議会会議録検索システム◇において、戦前・戦中期分(明治23(1890)年11月~昭和20(1945)年8月)の速記録の画像データ(合計約27万ページ)からOCR(光学的文字認識)処理により作成した本文テキストデータを、新たに公開しました。
>なお、今回公開した戦前・戦中期分の本文テキストデータは、人手による校正を行った戦後期分と異なり、OCR処理による文字の認識間違い(誤字・脱字)や認識不能を意味する文字「〓(ゲタ文字)」があり、検索や表示(発言単位の切り分け)が正確に行えない場合があります。
>これらについては、公開後もデータ整備を行ってまいります。