書籍の本文に含まれるキーワードから、本の題名などを検索できる Google の日本語版のサービスが2007年7月5日から始まった。「Google ブック検索」といって、キーワードを入力すると、その言葉が使われている本のリストが表示される。これはと思う本をクリックすると書籍の本文ページが現れるので驚いた。
同様のサービスはアメリカでは2004年に始まっていて、日本語版は10ヵ国目になるそうだ。いずれ、日本語版も始まるだろうとと思っていたけど、実際に始まってみると、これはすごいことではないかとひしひしと感じる。今のところは、表示されるのは書籍全ページではなくて、その20ページだから、どうしても読みたいとしたら購入するか図書館を探す事になる。しかし、著作権が消滅している場合や出版社もしくは著者の許可がある場合は全文を表示することが可能らしい。本好きや調べものをしている人にはすごくありがたいサービスに違いない。
サービスの詳しい内容、使い方は以下のページでよく分かる。
CNET Japan / Google ブック検索、日本語版がオープン–書籍の全文表示も
出版社はこのサービスをどのように受け止めているのかは以下で、
YOMIURI ONLINE / 本の中身が読める グーグル新検索 出版社、期待と警戒
また、7月6日にはこのブック検索でGoogleと慶応義塾大学図書館との提携が発表された。
CNET Japan / Google、ブック検索で慶応義塾大学図書館と連携–図書館はアジアで初の参加
ぼく自身は最近、絶版になった書籍のPDF化を仕事で終えたばかりだったので、このサービス開始を感慨深く受け止めた。ジーン・シノダ・ボーレン著『女はみんな女神』という400ページの書籍をスキャナ読み取り、OCRソフトでテキストデータ化、PDFファイル作成、ネットにアップという作業でした。
苦労したのは、OCRでのテキスト化の校正。スキャナもそこそこのものを使い、OCRソフトもこの仕事のために最新バージョンにしたので、かなりの精度でテキスト化をしているが、完璧ではない。完璧でない誤変換を校正で見つけるというのが大変だった。
興味のある方は
女性ライフサイクル研究所 / 女はみんな女神からダウンロードできます。