2008年5月27日

GCOEセミナー発表報告

本発表では、最初に「外地」文学研究で資料の共有化がいかに必要であるか述べ、現在作成中の『京城日報』文芸記事DBの概要について説明した。『京城日報』は日本統治期の「朝鮮」における文化動向を知る上で重要な資料であり、個々の記事検索・閲覧システムを作ることには意義がある。今回発表したデモ版DBは、ファイルメーカーで作成した記事目録と、PDF形式の記事画面を組み合わせたものである。発表者は記事の多様性を示して、文献としての面白さを強調した。その上で、ある程度の蓄積がなされた後で、他の文学雑誌の総目録などと連携した総合的文献DBを作りたいという構想を述べた。
発表に対するの質疑では
①紙面の画像データだけでなく、テキストデータもあった方が望ましい。旧字の読み取りについては八村先生のキャラクタ・スポッティングの研究を参照のこと。
②このデータベースを作成した背景には、どのような研究テーマがあるのか
③個々の作品を深く研究していく文学研究の在り方と、拡散していくDBの在り方をどう関係づけるのか
④紙面の画像データを公開する場合、著作権はどうなるのか
⑤「文芸記事」とカテゴリー化した場合、その範囲は恣意的にならないか
といった質問・指摘があった。
 
①は記事索引を行う場合、作者名・作品名等だけでなく、本文の語句からヒットするようなDBの方が、活用の幅が広がるということである。ただ、膨大な本文をいかにテキスト化するのか、という問題点が残る。
②③は従来の文学研究とデジタル活用との繋がりを問われた、デジタル・ヒューマニティーズ全体に関わる質問である。
④は国会図書館に確認したところ、『京城日報』は大正~昭和前期の新聞であり著作権保護期間を過ぎていること、また国会図書館作成のマイクロフィルムを大学の資料として所蔵している場合、記事画面の公開に問題はないとのことであった。今後はマイクロフィルム版に基づいてデータを作成していきたい。
⑤はデータ入力者が異なればデータの抽出も異なってくるのではないか、という質問である。確かに周辺分野の記事などは、拾われる精度が人によって異なるだろうが、小説や短歌・俳句など、中心的なジャンルはぶれがないと思われる。ただ、理想的には異なる専門分野を持つ人々が複数で共同して、各自記事を抽出していく作業がもっとも網羅的であると考えられる。

トラックバック(0)

このブログ記事を参照しているブログ一覧: GCOEセミナー発表報告

このブログ記事に対するトラックバックURL: http://www.arc.ritsumei.ac.jp/lib/mt_gcoe/mt-tb.cgi/1165

コメントする