使い方、よくある質問、新着情報など
goo ヘルプ
平成20年6月30日
「goo Wikipedia記事」を日本語自然文で検索できる 「goo Wikipedia自然文検索」の実験開始について 〜「富士山の高さは?」といった自然文でのWikipedia記事検索は 国内ポータルサイトでは初!〜 URL:http://qa.wpedia.search.goo.ne.jp/
NTTレゾナント株式会社(*1、本社:東京都千代田区、代表取締役社長:中嶋 孝夫)は、インターネットポータルサイト「goo」(*2)で提供している「goo Wikipedia記事検索」において、本日より「富士山の高さは?」といった日本語自然文で「goo Wikipedia記事検索」内の記事を検索できる「goo Wikipedia自然文検索」の実験を開始します。 日本語自然文によるWikipedia記事の検索機能の提供は、国内主要ポータルサイトにおいては初の取り組みとなります。
1.サービスの概要 「goo Wikipedia自然文検索」は、「goo Wikipedia記事」の約48万件(平成20年6月現在)の記事を対象に、「安土城を建てたのは誰?」や「OPECって何?」といった話し言葉で表現された質問で検索することができるサービスです。 「goo Wikipedia自然文検索」では、質問内容を解析し、「goo Wikipedia記事」の検索結果から質問の回答候補となりうる表現を判定・表示するとともに、質問に対する回答を含む可能性が高い記事を表示します。 話し言葉で検索することができるため、ユーザは知りたい情報をより簡単に調べることができるようになります。
2.技術ポイント (1)「goo Wikipedia記事」本文からの回答抽出 質問内容を解析して、人名や地名などの名称、日付や金額などの数量、言葉の定義などの質問の種類を判定し、「goo Wikipedia記事検索」での検索結果から回答候補となりうる表現を抽出します。また、「goo Wikipedia記事検索」での検索結果の記事内における表現の出現位置などから、質問に対する回答としての確からしさのスコアを計算し、スコアの高い順に表示します。 (2)「goo Wikipedia記事」からの知識の抽出 あらかじめ「goo Wikipedia記事検索」内の記事を解析して知識データベースを作成しています。入力された質問文と知識データベースをマッチングし、質問に該当する知識がある場合には、精度の高い回答を返すことができます。 例えば、「goo Wikipedia記事検索」内の「アイルトン・セナ」という記事を解析することによって抽出された「アイルトン・セナ」、「優勝回数」、「41」という表現から「アイルトン・セナの優勝回数は41回である」という知識を獲得し、知識データベースに蓄積しています。この「知識」を利用して、「アイルトン・セナの優勝回数は?」、「優勝回数が41回のF1ドライバーは?」といった質問に対して、それぞれ「41」、「アイルトン・セナ」と回答することができます。 現在390万件の「知識」を蓄積しており、「goo Wikipedia記事検索」に新しい記事が追加されると「知識」も増えていきます。
3.アクセス方法 (1)「goo」トップページ(http://www.goo.ne.jp/)から「Wiki記事」をクリック ⇒「goo Wikipedia記事検索」トップページから「goo Wikipedia自然文検索」タブをクリック (2)「goo」トップページ(http://www.goo.ne.jp/)から「gooラボ」をクリック ⇒「goo Wikipedia自然文検索」をクリック ※以下のURLから直接アクセスすることも可能です。 URL:http://qa.wpedia.search.goo.ne.jp/