文書作成支援装置
【目的】 表と文章の内容の矛盾する部分を検出し、構成作業を容易にする。
【構成】 入力された文書のうちの表については、表意味変換手段2により、表中の各項目の名称及びデータについての表単語辞書9が作成されるとともに、表中に含まれる1まとまりの意味を表わした表意味表現10が作成される。一方、入力された文書のうちの文章については、形態素解析手段3により、単語辞書8及び表単語辞書9を参照して構文解析が行なわれる。そして、構文意味解析手段4により、構文意味解析ルール11に従って、構文の意味が解析され、文意味表現12が作成される。この文意味表現12は、表意味表現10と同様の形式で作成される結果、意味照合手段5により両者を照合することが可能となる。そして、意味照合手段5での照合により矛盾候補が挙げられ、それらが矛盾候補表示手段6により表示される。
【構成】 入力された文書のうちの表については、表意味変換手段2により、表中の各項目の名称及びデータについての表単語辞書9が作成されるとともに、表中に含まれる1まとまりの意味を表わした表意味表現10が作成される。一方、入力された文書のうちの文章については、形態素解析手段3により、単語辞書8及び表単語辞書9を参照して構文解析が行なわれる。そして、構文意味解析手段4により、構文意味解析ルール11に従って、構文の意味が解析され、文意味表現12が作成される。この文意味表現12は、表意味表現10と同様の形式で作成される結果、意味照合手段5により両者を照合することが可能となる。そして、意味照合手段5での照合により矛盾候補が挙げられ、それらが矛盾候補表示手段6により表示される。
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、表を含む文書において表の内容と文章の内容の矛盾を検出できるようにした文書作成支援装置に関するものである。
【0002】
【従来の技術】従来、ワードプロセッサやデスクトップパブリッシングシステム等で作成した文書の構成を行なう文書校正装置がある。このような従来の文書校正装置は、作成した文書中の漢字の送り仮名の表記の誤りを検出し、訂正するものであった(例えば、文書校正支援システムにおける校正知識の構築方法、情報処理学会研究報告Vol.92,No.21,pp.79-86 (社団法人 情報処理学会 1992年 3月13日発行)参照)。
【0003】
【発明が解決しようとする課題】しかしながら、上述した従来の技術には、次のような課題があった。即ち、表で表わした内容を文章で説明したり、文章で説明した内容を表にまとめて表わした場合に、文で説明した内容が表の内容と矛盾することがよくある。例えば、ある小売店の支店ごとの売上げの状況を表と文章で説明する場合に、表では「大阪支店」の「売上」が「200億円」となっているのに、文章では「100億円」になっている等の場合である。このような矛盾は、表と文章のいずれかが間違っているために生じるが、従来は、ユーザが表と文章を両方とも校閲して誤りを発見しなければこのような矛盾を解消することができなかった。
【0004】
【課題を解決するための手段】本発明の文書作成支援装置は、上述した課題を解決するため、以下の点を特徴とするものである。
(1)
■文書中の表の内容を表わす表意味表現を作成する表意味変換手段を備える。
■文書中の文章の内容を解析し、その内容を表わす文意味表現を作成する構文意味解析手段を備える。
■表意味変換手段により作成された意味表現及び構文意味解析手段により作成された意味表現の相互を照合し、意味が矛盾する部分を指摘する意味照合手段を備える。
■当該意味照合手段により指摘された部分を矛盾候補として表示する矛盾候補表示手段を備える。
【0005】(2)(1)において、矛盾候補表示手段により矛盾候補として表示された部分を指定するための情報を所定のフィールドに入力するとともに、変更後のデータを入力することにより文書を変更する文書変更手段を備える。
【0006】
【作用】
(1)入力された文書のうちの表については、表意味変換手段により、表中の各項目の名称及びデータについての表単語辞書が作成されるとともに、表中に含まれる1まとまりの意味を表わした表意味表現が作成される。一方、入力された文書のうちの文章については、形態素解析手段により、単語辞書及び表単語辞書を参照して構文解析が行なわれる。そして、構文意味解析手段により、構文意味解析ルールに従って、構文の意味が解析され、文意味表現が作成される。この文意味表現は、表意味表現と同様の形式で作成される結果、意味照合手段により両者を照合することが可能となる。照合手段では、ある1まとまりの意味内容を持った表意味表現と文意味表現の相互が完全に一致せず、一部のみが不一致であるときは、誤記の可能性があると判断し、矛盾候補とする。これらの矛盾候補は、矛盾候補表示手段によりディスプレイにより表示される。この結果、利用者は、これらの矛盾候補として挙げられた部分についてのみチェックするだけで校正作業を済ませることができる。
【0007】(2)(1)において、矛盾候補表示手段により矛盾候補を表示する際に、通番を付し、所定のフィールドにその通番を入力するとともに、変更後のデータを入力するようにすることにより、校正作業を容易に行なえるようにすることができる。
【0008】
【実施例】以下、本発明の実施例を図面を参照して詳細に説明する。図1は、本発明の文書作成支援装置の一実施例のブロック図である。図示の装置は、文書入力手段1、表意味変換手段2、形態素解析手段3、構文意味解析手段4、意味照合手段5、矛盾候補表示手段6、文書変更手段7等から成る。
【0009】文書入力手段1は、レンズ等の光学系、CCD、走査系等から成り、紙面等に記載された文書を光学的に読み取り、ディジタルデータに変換して図示しないメモリに読み込む。文書には、自然言語の文章だけから成る文書領域、表領域、図領域、グラフ領域等の各種の領域があるものとする。そして、文書入力手段1は、これらの文書を構成する要素をメモリから別々に取り出す機能を有する。即ち、文書入力手段1は、文章、表、図、グラフの各データをそれぞれ別々に格納し、それぞれ別々に取り出すことができる。このような文書入力手段1は、磁気ディスクや光磁気ディスク等の2次記憶装置からメモリにロードする手段とあわせて構成してもよいし、紙に印刷された文書をコード情報に変換する文書認識装置と合せて構成してもよい。
【0010】表意味変換手段2は、プロセッサ等から成り、メモリに格納された表領域の内容を表単語辞書9と表意味表現10に変換する。即ち、表から枠により列及び行を検出し、各列及び行に記載された文字を認識し、表という形式から表単語辞書9という形式に変換する。また、ある1つのまとまった意味内容を表わす表意味表現10という形式に変換する。このようにして作成された表意味表現10は、ディスク装置等の所定の記憶領域に格納される。形態素解析手段3は、プロセッサ等から成り、メモリに格納された自然言語の文章だけから成る文書領域の文章を、単語表記と品詞を各単語に対して規定した単語辞書8を用いて単語に分割する。即ち、形態素解析手段3は、メモリに格納された文章を単語に区切り、各単語を単語辞書8で検索し、品詞を特定する。
【0011】構文意味解析手段4は、プロセッサ等から成り、構文意味解析ルール11を用いて単語に分割された入力文を1まとまりの意味を持った文意味表現12に変換する。即ち、入力文が複合的な意味を持ったいわゆる複文であっても、構文意味解析ルール11により、それらの複文は単純な1まとまりの意味の単文に変換される。この単文が文意味表現12の形式で表現される。
【0012】意味照合手段5は、プロセッサ等から成り、表意味表現10と文意味表現12との相互の照合を行なう。即ち、双方の構成要素を比較することによってすべての構成要素が一致していれば、同一の意味内容とみなし、すべてが不一致であれば、別個の意味内容とみなす。そして、一部分のみが一致し、不一致の部分が含まれるときは、同一の意味内容とすべきものの誤記の可能性があると判断し、それらを矛盾候補とする。矛盾候補表示手段6は、ディスプレイ等の表示装置により、意味照合手段5の照合結果を利用者に対して表示する。例えば、矛盾候補として挙げられた部分に下線等を付して利用者に対し、誤記の可能性のある部分を明示する。文書変更手段7は、ディスプレイ等に所定の入力フィールドを表示し、矛盾候補表示手段6により指摘された部分について利用者が修正箇所を指定して文書の内容を変更するための処理を行なう。即ち、入力フィールドによる利用者からの指定に従って文書中の修正箇所の位置を検出し、表又は文の内容を変更する。
【0013】次に、上述した装置の動作を説明する。まず、図2を参照して図1の装置における処理の流れの概要を説明する。ステップS21では、文書入力手段1が文書をメモリ(図示省略)に読み込む。そして、ステップS22では、読み込んだ文章中に表がない場合は処理を終了する。ステップS23では、表意味変換手段2がメモリ内の文書中の表領域を表意味表現10及び表単語辞書9に変換する。ステップS24では、形態素解析手段3が単語辞書8及び表単語辞書9を用いてメモリ内の文書中の文書領域の文章を形態素解析する。この解析の詳細については後述する。ステップS25では、形態素解析した結果が構文意味解析手段4により構文意味解析ルール11を用いて文意味表現12に変換される。ステップS26では、意味照合手段5が表意味表現10と文意味表現12との照合を行なう。ステップS27では、照合の結果、表の意味内容と文章の意味内容に矛盾が生じた時は、ステップS28で矛盾候補表示手段6が矛盾候補を表示する。矛盾候補が存在しない場合は表示をせずに処理を終了する。
【0014】次に、図3〜図11に示す実際のデータを用いて動作を説明する。入力文書の一例を図3に示す。図2のステップS21では、図3の文書を画像メモリに読み込む。図3に示す文書は文章と表とから構成されている。文書中には、文章と表の各データ31、32がそれぞれ別々に格納されており、ステップS22で、画像メモリに読み込まれたデータに表のデータが含まれているか否かにより表の有無を検出することができる。文書中に表が含まれている場合には、表を、表意味表現10と、表単語辞書9とに変換する。図3の表を表単語辞書9に変換した結果を図4に示す。
【0015】表は、一般に、表の各項目の名称、それらの項目に対応するデータにより構成されている。図3の表の中で各項目の名称を記述している部分33、34は、第1列目(以下、「列1」という)が「支店」、列2が「売上高」、列2の単位を指定する記述が「億円」である。これらの記述を取り出して所定の形式に変換したものが図4の表単語辞書9である。即ち、表単語辞書9は見出し401、属性402から成り、表の記載形式により、列1の一番上に記載されている「支店」は、列1の名称403であると判断される。同様に、列2の一番上に記載されている「売上高」は、列2の名称404であると判断される。一方、列2の一番上において括弧で囲まれている「億円」は、列2のデータの単位405であると判断される。
【0016】また、各列の2番目以下には、各列のデータ35、36、37、38が記述されている。例えば、列1の「支店」については、「大阪」、「京都」、「滋賀」、「三重」というデータが記述されている。そして、列2の「売上高」については、「200」、「200」、「100」、「100」が記述されている。この場合、単位は、「億円」である。これらのデータは、図4R>4の表単語辞書9において、単位405の後に格納される。即ち、まず、列1のデータについて、「大阪」、「京都」、「滋賀」、「三重」が順に格納され、それらの属性は列1データ406、407、408、409とされる。次に、列2のデータについて、「200」、「200」、「100」、「100」が順に格納され、それらの属性は列2データ410、411、412、413とされる。
【0017】図5は、図3の表から作成した表意味表現10を示している。「=」の左側は列の名称51であり、右側は当該列のデータ52を示している。この「=」と「|」、「|」により、1つの表意味表現10が構成される。即ち、表意味表現53は、「大阪の支店の売上高が200億円である」という意味を表現する。表意味表現54は、「京都の支店の売上高が200億円である」という意味を表現する。表意味表現55は、「滋賀の支店の売上高が100億円である」という意味を表現する。また、表意味表現56は、「三重の支店の売上高が100億円である」という意味を表現する。
【0018】次に、ステップS24では、図3の文章領域について、単語辞書8及び表単語辞書9を用いて形態素解析を行なう。単語辞書8の例を図6に示す。単語辞書8は、単語見出し61及び品詞62から構成される。まず、図3の文章中の「大阪支店は、売上が100億円である。」という文を単語に区切る。そして、最初の行63にある単語「大阪」をキーとして単語辞書8を検索する。すると、「大阪」は品詞が名詞であると判断される。一方、「大阪」をキーとして表単語辞書9を検索する。すると、「大阪」は表における列1データであると判断される。以下、「支店」、「は」、「、」等についても、単語辞書8及び表単語辞書9を用いて形態素解析を行なう。この結果を図7に示す。図7により、例えば、「大阪」71は名詞72であり、かつ列1データ73であることが表わされる。
【0019】ステップS25では、図3の文章領域について、構文解析及び意味解析を行なう。構文解析及び意味解析で用いるルールを図8に示す。各ルールは、ルールのID81、ルールを適用するための条件82、及び条件成立時の変換動作83等から構成される。図8において、N1、N2は名詞の単語を表わす。V1は品詞が数値である単語を表わす。U1は品詞が単位である単語を表わす。引用符「“」、「”」で囲まれているところは、文書中の文字列を表わす。また、「:」の後ろは品詞名を表わす。構文意味解析手段4は、図8に示すような構文意味解析ルール11を図7の形態素解析した結果に適用する。即ち、各ルールの条件を形態素解析の結果と照合し、一致するかどうかを調べる。一致する場合は、その一致したルールの変換動作を実行する。これらのルールの適用は適用できるルールがなくなるまで行なう。
【0020】例えば、図7の形態素解析の結果に図8のルールを適用すると、まず、「大阪支店」の部分にはルールR1が適用される。即ち、「大阪支店」の「大阪」はN1に対応し、「支店」はN2に対応する。その結果、変換動作により「支店」は列の名称であり、「大阪」はそのデータであると判断される。これを図5の形式で表わすと、次のようになる。
|支店=大阪|また、図7の形態素解析の結果の「売上高が100億円である。」の部分には、ルールR3が適用される。即ち、ルールR3を適用すると、「売上高」、「100」、「億円」はそれぞれ、N1、N2、U1に対応する。その結果、変換動作により「売上高」は列の名称であり、「100億円」は値であると判断される。
【0021】これを図5の形式で表わすと、次のようになる。
|売上高=200億円|また、図7の形態素解析の結果には、否定を表わす“ない”が出てこないのでルールR5とも対応する。その結果、変換動作により、次のような文意味表現が書かれる。
|真偽値=真|以上の3つの文意味表現をまとめると図9のような文意味表現になる。図9の文意味表現は「真偽値」を除くと、その列の名称91は表意味表現の列の名称51を示しており、当該列のデータ92の値は表意味表現のデータ52の値を示している。
【0022】ステップS26では、文意味表現と表意味表現との照合を行なう。本実施例では、真偽値が真である文意味表現について、すべての列名に対して、対応する値が等しい場合には、文意味表現93と表意味表現53とは完全に一致するとみなす。それ以外の場合は一致しないとみなす。そして、一致しない文意味表現と表意味表現のうち、値が1つだけ異なるものを矛盾候補として集める。即ち、図5のうち、3つの表意味表現53、55、56を矛盾候補として集める。一方、値が2つ以上異なるものは矛盾候補とはしない。即ち、図5の表意味表現54は、「支店」も「売上高」も異なるので、矛盾候補とはならず、集める対象にはならない。
【0023】ステップS27では、ステップS26で矛盾候補があったか否かを判別する。図示の例では、矛盾したものがあるので、ステップS28で結果を表示する。図10に矛盾候補の表示例を示す。表示結果中の下線(1)、(2) は図9の文意味表現93の値に対応する箇所を示している。下線(3) は、図9の文意味表現93と、図5の表意味表現53の矛盾する部分を示している。同様に下線(4)、(5) は、図5の表意味表現55、56との矛盾する部分を示している。本装置の利用者はこの表示を見て修正すべき箇所の下線の番号をフィールド101に入力し、正しい値をフィールド102に入力することができる。その後、変更ボタン103を押すことで、文書変更手段7によって変更が文書に反映される。そして、終了ボタン104を押すことで処理が終了する。
【0024】図11に、図10で下線(3) を選択し、変更後の値として「100」を入力した場合の修正完了後の文書を示す。このようにして、文書中の文章で記述した内容と、表の内容に矛盾がある箇所を自動的に発見することができ、正しい文書を作成することができる。
【0025】尚、本発明は上述した実施例に限定されるものではなく、種々の変形が可能であることはもちろんである。例えば、構文意味解析ルール11は、図示の例に限らず、他のあらゆるルールを追加することができる。これにより、より複雑な文章を解析することが可能となる。また、上述した実施例においては、意味照合手段5で集める矛盾候補を値が1つだけ異なるものとしたが、これに限らず、2つ以上異なるものを含めるようにしてもよい。これにより、より広範囲の矛盾候補を集めることができる。更に、単語辞書8の品詞の名称は適宜変更することができる。また、単語辞書8には、単語の見出し語と、品詞以外の情報が含まれていてもかまわない。更に、利用者が矛盾候補の表示の中から矛盾する箇所の下線の番号を選択する手段としてマウス等のポインティングデバイス、音声認識、タッチパネル等を使用するようにしてもよい。
【0026】尚、表の中の項目の名称が複数の単語から成る場合には、そのような複数の単語に対し、上述した実施例における文章に対する形態素解析と同様の形態素解析を行ない、その後、表意味変換手段2により表の意味表現を作成するようにすればよい。
【0027】
【発明の効果】以上説明したように、本発明の文書作成支援装置によれば、表と文章の意味内容を統一的に表わした意味表現を作成し、表の意味表現と文章の意味表現を照合するようにしたので、表の内容と、文章の内容の矛盾を検出することができる。従って、表で表わした内容を文章で説明したり、文章で説明した内容を表にまとめて表わした場合に生じることがある矛盾を自動的に検出することができる。これにより、ユーザに対し、表と文章のいずれかの間違いの修正を促すことができ、このような矛盾を解消することができる。
【図面の簡単な説明】
【図1】本発明の文書作成支援装置の一実施例のブロック図である。
【図2】図1の装置の処理手順を説明するフローチャートである。
【図3】図1の装置による校正の対象とされる文書の一例の説明図である。
【図4】図3の表から作成される表単語辞書の一例の説明図である。
【図5】図3の表から作成される表意味表現の一例の説明図である。
【図6】予め用意されている単語辞書の一例の説明図である。
【図7】形態素解析結果の一例の説明図である。
【図8】予め用意されている構文意味解析ルールの一例の説明図である。
【図9】構文意味解析の結果作成される文意味表現の一例の説明図である。
【図10】矛盾候補の表示例の一例の説明図である。
【図11】文書修正結果の一例の説明図である。
【符号の説明】
2 表意味変換手段
3 形態素解析手段
4 構文意味解析手段
5 意味照合手段
6 矛盾候補表示手段
7 文書変更手段
【0001】
【産業上の利用分野】本発明は、表を含む文書において表の内容と文章の内容の矛盾を検出できるようにした文書作成支援装置に関するものである。
【0002】
【従来の技術】従来、ワードプロセッサやデスクトップパブリッシングシステム等で作成した文書の構成を行なう文書校正装置がある。このような従来の文書校正装置は、作成した文書中の漢字の送り仮名の表記の誤りを検出し、訂正するものであった(例えば、文書校正支援システムにおける校正知識の構築方法、情報処理学会研究報告Vol.92,No.21,pp.79-86 (社団法人 情報処理学会 1992年 3月13日発行)参照)。
【0003】
【発明が解決しようとする課題】しかしながら、上述した従来の技術には、次のような課題があった。即ち、表で表わした内容を文章で説明したり、文章で説明した内容を表にまとめて表わした場合に、文で説明した内容が表の内容と矛盾することがよくある。例えば、ある小売店の支店ごとの売上げの状況を表と文章で説明する場合に、表では「大阪支店」の「売上」が「200億円」となっているのに、文章では「100億円」になっている等の場合である。このような矛盾は、表と文章のいずれかが間違っているために生じるが、従来は、ユーザが表と文章を両方とも校閲して誤りを発見しなければこのような矛盾を解消することができなかった。
【0004】
【課題を解決するための手段】本発明の文書作成支援装置は、上述した課題を解決するため、以下の点を特徴とするものである。
(1)
【0005】(2)(1)において、矛盾候補表示手段により矛盾候補として表示された部分を指定するための情報を所定のフィールドに入力するとともに、変更後のデータを入力することにより文書を変更する文書変更手段を備える。
【0006】
【作用】
(1)入力された文書のうちの表については、表意味変換手段により、表中の各項目の名称及びデータについての表単語辞書が作成されるとともに、表中に含まれる1まとまりの意味を表わした表意味表現が作成される。一方、入力された文書のうちの文章については、形態素解析手段により、単語辞書及び表単語辞書を参照して構文解析が行なわれる。そして、構文意味解析手段により、構文意味解析ルールに従って、構文の意味が解析され、文意味表現が作成される。この文意味表現は、表意味表現と同様の形式で作成される結果、意味照合手段により両者を照合することが可能となる。照合手段では、ある1まとまりの意味内容を持った表意味表現と文意味表現の相互が完全に一致せず、一部のみが不一致であるときは、誤記の可能性があると判断し、矛盾候補とする。これらの矛盾候補は、矛盾候補表示手段によりディスプレイにより表示される。この結果、利用者は、これらの矛盾候補として挙げられた部分についてのみチェックするだけで校正作業を済ませることができる。
【0007】(2)(1)において、矛盾候補表示手段により矛盾候補を表示する際に、通番を付し、所定のフィールドにその通番を入力するとともに、変更後のデータを入力するようにすることにより、校正作業を容易に行なえるようにすることができる。
【0008】
【実施例】以下、本発明の実施例を図面を参照して詳細に説明する。図1は、本発明の文書作成支援装置の一実施例のブロック図である。図示の装置は、文書入力手段1、表意味変換手段2、形態素解析手段3、構文意味解析手段4、意味照合手段5、矛盾候補表示手段6、文書変更手段7等から成る。
【0009】文書入力手段1は、レンズ等の光学系、CCD、走査系等から成り、紙面等に記載された文書を光学的に読み取り、ディジタルデータに変換して図示しないメモリに読み込む。文書には、自然言語の文章だけから成る文書領域、表領域、図領域、グラフ領域等の各種の領域があるものとする。そして、文書入力手段1は、これらの文書を構成する要素をメモリから別々に取り出す機能を有する。即ち、文書入力手段1は、文章、表、図、グラフの各データをそれぞれ別々に格納し、それぞれ別々に取り出すことができる。このような文書入力手段1は、磁気ディスクや光磁気ディスク等の2次記憶装置からメモリにロードする手段とあわせて構成してもよいし、紙に印刷された文書をコード情報に変換する文書認識装置と合せて構成してもよい。
【0010】表意味変換手段2は、プロセッサ等から成り、メモリに格納された表領域の内容を表単語辞書9と表意味表現10に変換する。即ち、表から枠により列及び行を検出し、各列及び行に記載された文字を認識し、表という形式から表単語辞書9という形式に変換する。また、ある1つのまとまった意味内容を表わす表意味表現10という形式に変換する。このようにして作成された表意味表現10は、ディスク装置等の所定の記憶領域に格納される。形態素解析手段3は、プロセッサ等から成り、メモリに格納された自然言語の文章だけから成る文書領域の文章を、単語表記と品詞を各単語に対して規定した単語辞書8を用いて単語に分割する。即ち、形態素解析手段3は、メモリに格納された文章を単語に区切り、各単語を単語辞書8で検索し、品詞を特定する。
【0011】構文意味解析手段4は、プロセッサ等から成り、構文意味解析ルール11を用いて単語に分割された入力文を1まとまりの意味を持った文意味表現12に変換する。即ち、入力文が複合的な意味を持ったいわゆる複文であっても、構文意味解析ルール11により、それらの複文は単純な1まとまりの意味の単文に変換される。この単文が文意味表現12の形式で表現される。
【0012】意味照合手段5は、プロセッサ等から成り、表意味表現10と文意味表現12との相互の照合を行なう。即ち、双方の構成要素を比較することによってすべての構成要素が一致していれば、同一の意味内容とみなし、すべてが不一致であれば、別個の意味内容とみなす。そして、一部分のみが一致し、不一致の部分が含まれるときは、同一の意味内容とすべきものの誤記の可能性があると判断し、それらを矛盾候補とする。矛盾候補表示手段6は、ディスプレイ等の表示装置により、意味照合手段5の照合結果を利用者に対して表示する。例えば、矛盾候補として挙げられた部分に下線等を付して利用者に対し、誤記の可能性のある部分を明示する。文書変更手段7は、ディスプレイ等に所定の入力フィールドを表示し、矛盾候補表示手段6により指摘された部分について利用者が修正箇所を指定して文書の内容を変更するための処理を行なう。即ち、入力フィールドによる利用者からの指定に従って文書中の修正箇所の位置を検出し、表又は文の内容を変更する。
【0013】次に、上述した装置の動作を説明する。まず、図2を参照して図1の装置における処理の流れの概要を説明する。ステップS21では、文書入力手段1が文書をメモリ(図示省略)に読み込む。そして、ステップS22では、読み込んだ文章中に表がない場合は処理を終了する。ステップS23では、表意味変換手段2がメモリ内の文書中の表領域を表意味表現10及び表単語辞書9に変換する。ステップS24では、形態素解析手段3が単語辞書8及び表単語辞書9を用いてメモリ内の文書中の文書領域の文章を形態素解析する。この解析の詳細については後述する。ステップS25では、形態素解析した結果が構文意味解析手段4により構文意味解析ルール11を用いて文意味表現12に変換される。ステップS26では、意味照合手段5が表意味表現10と文意味表現12との照合を行なう。ステップS27では、照合の結果、表の意味内容と文章の意味内容に矛盾が生じた時は、ステップS28で矛盾候補表示手段6が矛盾候補を表示する。矛盾候補が存在しない場合は表示をせずに処理を終了する。
【0014】次に、図3〜図11に示す実際のデータを用いて動作を説明する。入力文書の一例を図3に示す。図2のステップS21では、図3の文書を画像メモリに読み込む。図3に示す文書は文章と表とから構成されている。文書中には、文章と表の各データ31、32がそれぞれ別々に格納されており、ステップS22で、画像メモリに読み込まれたデータに表のデータが含まれているか否かにより表の有無を検出することができる。文書中に表が含まれている場合には、表を、表意味表現10と、表単語辞書9とに変換する。図3の表を表単語辞書9に変換した結果を図4に示す。
【0015】表は、一般に、表の各項目の名称、それらの項目に対応するデータにより構成されている。図3の表の中で各項目の名称を記述している部分33、34は、第1列目(以下、「列1」という)が「支店」、列2が「売上高」、列2の単位を指定する記述が「億円」である。これらの記述を取り出して所定の形式に変換したものが図4の表単語辞書9である。即ち、表単語辞書9は見出し401、属性402から成り、表の記載形式により、列1の一番上に記載されている「支店」は、列1の名称403であると判断される。同様に、列2の一番上に記載されている「売上高」は、列2の名称404であると判断される。一方、列2の一番上において括弧で囲まれている「億円」は、列2のデータの単位405であると判断される。
【0016】また、各列の2番目以下には、各列のデータ35、36、37、38が記述されている。例えば、列1の「支店」については、「大阪」、「京都」、「滋賀」、「三重」というデータが記述されている。そして、列2の「売上高」については、「200」、「200」、「100」、「100」が記述されている。この場合、単位は、「億円」である。これらのデータは、図4R>4の表単語辞書9において、単位405の後に格納される。即ち、まず、列1のデータについて、「大阪」、「京都」、「滋賀」、「三重」が順に格納され、それらの属性は列1データ406、407、408、409とされる。次に、列2のデータについて、「200」、「200」、「100」、「100」が順に格納され、それらの属性は列2データ410、411、412、413とされる。
【0017】図5は、図3の表から作成した表意味表現10を示している。「=」の左側は列の名称51であり、右側は当該列のデータ52を示している。この「=」と「|」、「|」により、1つの表意味表現10が構成される。即ち、表意味表現53は、「大阪の支店の売上高が200億円である」という意味を表現する。表意味表現54は、「京都の支店の売上高が200億円である」という意味を表現する。表意味表現55は、「滋賀の支店の売上高が100億円である」という意味を表現する。また、表意味表現56は、「三重の支店の売上高が100億円である」という意味を表現する。
【0018】次に、ステップS24では、図3の文章領域について、単語辞書8及び表単語辞書9を用いて形態素解析を行なう。単語辞書8の例を図6に示す。単語辞書8は、単語見出し61及び品詞62から構成される。まず、図3の文章中の「大阪支店は、売上が100億円である。」という文を単語に区切る。そして、最初の行63にある単語「大阪」をキーとして単語辞書8を検索する。すると、「大阪」は品詞が名詞であると判断される。一方、「大阪」をキーとして表単語辞書9を検索する。すると、「大阪」は表における列1データであると判断される。以下、「支店」、「は」、「、」等についても、単語辞書8及び表単語辞書9を用いて形態素解析を行なう。この結果を図7に示す。図7により、例えば、「大阪」71は名詞72であり、かつ列1データ73であることが表わされる。
【0019】ステップS25では、図3の文章領域について、構文解析及び意味解析を行なう。構文解析及び意味解析で用いるルールを図8に示す。各ルールは、ルールのID81、ルールを適用するための条件82、及び条件成立時の変換動作83等から構成される。図8において、N1、N2は名詞の単語を表わす。V1は品詞が数値である単語を表わす。U1は品詞が単位である単語を表わす。引用符「“」、「”」で囲まれているところは、文書中の文字列を表わす。また、「:」の後ろは品詞名を表わす。構文意味解析手段4は、図8に示すような構文意味解析ルール11を図7の形態素解析した結果に適用する。即ち、各ルールの条件を形態素解析の結果と照合し、一致するかどうかを調べる。一致する場合は、その一致したルールの変換動作を実行する。これらのルールの適用は適用できるルールがなくなるまで行なう。
【0020】例えば、図7の形態素解析の結果に図8のルールを適用すると、まず、「大阪支店」の部分にはルールR1が適用される。即ち、「大阪支店」の「大阪」はN1に対応し、「支店」はN2に対応する。その結果、変換動作により「支店」は列の名称であり、「大阪」はそのデータであると判断される。これを図5の形式で表わすと、次のようになる。
|支店=大阪|また、図7の形態素解析の結果の「売上高が100億円である。」の部分には、ルールR3が適用される。即ち、ルールR3を適用すると、「売上高」、「100」、「億円」はそれぞれ、N1、N2、U1に対応する。その結果、変換動作により「売上高」は列の名称であり、「100億円」は値であると判断される。
【0021】これを図5の形式で表わすと、次のようになる。
|売上高=200億円|また、図7の形態素解析の結果には、否定を表わす“ない”が出てこないのでルールR5とも対応する。その結果、変換動作により、次のような文意味表現が書かれる。
|真偽値=真|以上の3つの文意味表現をまとめると図9のような文意味表現になる。図9の文意味表現は「真偽値」を除くと、その列の名称91は表意味表現の列の名称51を示しており、当該列のデータ92の値は表意味表現のデータ52の値を示している。
【0022】ステップS26では、文意味表現と表意味表現との照合を行なう。本実施例では、真偽値が真である文意味表現について、すべての列名に対して、対応する値が等しい場合には、文意味表現93と表意味表現53とは完全に一致するとみなす。それ以外の場合は一致しないとみなす。そして、一致しない文意味表現と表意味表現のうち、値が1つだけ異なるものを矛盾候補として集める。即ち、図5のうち、3つの表意味表現53、55、56を矛盾候補として集める。一方、値が2つ以上異なるものは矛盾候補とはしない。即ち、図5の表意味表現54は、「支店」も「売上高」も異なるので、矛盾候補とはならず、集める対象にはならない。
【0023】ステップS27では、ステップS26で矛盾候補があったか否かを判別する。図示の例では、矛盾したものがあるので、ステップS28で結果を表示する。図10に矛盾候補の表示例を示す。表示結果中の下線(1)、(2) は図9の文意味表現93の値に対応する箇所を示している。下線(3) は、図9の文意味表現93と、図5の表意味表現53の矛盾する部分を示している。同様に下線(4)、(5) は、図5の表意味表現55、56との矛盾する部分を示している。本装置の利用者はこの表示を見て修正すべき箇所の下線の番号をフィールド101に入力し、正しい値をフィールド102に入力することができる。その後、変更ボタン103を押すことで、文書変更手段7によって変更が文書に反映される。そして、終了ボタン104を押すことで処理が終了する。
【0024】図11に、図10で下線(3) を選択し、変更後の値として「100」を入力した場合の修正完了後の文書を示す。このようにして、文書中の文章で記述した内容と、表の内容に矛盾がある箇所を自動的に発見することができ、正しい文書を作成することができる。
【0025】尚、本発明は上述した実施例に限定されるものではなく、種々の変形が可能であることはもちろんである。例えば、構文意味解析ルール11は、図示の例に限らず、他のあらゆるルールを追加することができる。これにより、より複雑な文章を解析することが可能となる。また、上述した実施例においては、意味照合手段5で集める矛盾候補を値が1つだけ異なるものとしたが、これに限らず、2つ以上異なるものを含めるようにしてもよい。これにより、より広範囲の矛盾候補を集めることができる。更に、単語辞書8の品詞の名称は適宜変更することができる。また、単語辞書8には、単語の見出し語と、品詞以外の情報が含まれていてもかまわない。更に、利用者が矛盾候補の表示の中から矛盾する箇所の下線の番号を選択する手段としてマウス等のポインティングデバイス、音声認識、タッチパネル等を使用するようにしてもよい。
【0026】尚、表の中の項目の名称が複数の単語から成る場合には、そのような複数の単語に対し、上述した実施例における文章に対する形態素解析と同様の形態素解析を行ない、その後、表意味変換手段2により表の意味表現を作成するようにすればよい。
【0027】
【発明の効果】以上説明したように、本発明の文書作成支援装置によれば、表と文章の意味内容を統一的に表わした意味表現を作成し、表の意味表現と文章の意味表現を照合するようにしたので、表の内容と、文章の内容の矛盾を検出することができる。従って、表で表わした内容を文章で説明したり、文章で説明した内容を表にまとめて表わした場合に生じることがある矛盾を自動的に検出することができる。これにより、ユーザに対し、表と文章のいずれかの間違いの修正を促すことができ、このような矛盾を解消することができる。
【図面の簡単な説明】
【図1】本発明の文書作成支援装置の一実施例のブロック図である。
【図2】図1の装置の処理手順を説明するフローチャートである。
【図3】図1の装置による校正の対象とされる文書の一例の説明図である。
【図4】図3の表から作成される表単語辞書の一例の説明図である。
【図5】図3の表から作成される表意味表現の一例の説明図である。
【図6】予め用意されている単語辞書の一例の説明図である。
【図7】形態素解析結果の一例の説明図である。
【図8】予め用意されている構文意味解析ルールの一例の説明図である。
【図9】構文意味解析の結果作成される文意味表現の一例の説明図である。
【図10】矛盾候補の表示例の一例の説明図である。
【図11】文書修正結果の一例の説明図である。
【符号の説明】
2 表意味変換手段
3 形態素解析手段
4 構文意味解析手段
5 意味照合手段
6 矛盾候補表示手段
7 文書変更手段
【特許請求の範囲】
【請求項1】 文書中の表の内容を表わす表意味表現を作成する表意味変換手段と、前記文書中の文章の内容を解析し、その内容を表わす文意味表現を作成する構文意味解析手段と、前記表意味変換手段により作成された表意味表現及び前記構文意味解析手段により作成された文意味表現の相互を照合し、意味が矛盾する部分を指摘する意味照合手段と、当該意味照合手段により指摘された部分を矛盾候補として表示する矛盾候補表示手段とから成ることを特徴とする文書作成支援装置。
【請求項2】 前記矛盾候補表示手段により矛盾候補として表示された部分を指定するための情報を所定のフィールドに入力するとともに、変更後のデータを入力することにより文書を変更する文書変更手段を備えたことを特徴とする請求項1記載の文書作成支援装置。
【請求項1】 文書中の表の内容を表わす表意味表現を作成する表意味変換手段と、前記文書中の文章の内容を解析し、その内容を表わす文意味表現を作成する構文意味解析手段と、前記表意味変換手段により作成された表意味表現及び前記構文意味解析手段により作成された文意味表現の相互を照合し、意味が矛盾する部分を指摘する意味照合手段と、当該意味照合手段により指摘された部分を矛盾候補として表示する矛盾候補表示手段とから成ることを特徴とする文書作成支援装置。
【請求項2】 前記矛盾候補表示手段により矛盾候補として表示された部分を指定するための情報を所定のフィールドに入力するとともに、変更後のデータを入力することにより文書を変更する文書変更手段を備えたことを特徴とする請求項1記載の文書作成支援装置。
【図3】
【図4】
【図5】
【図1】
【図6】
【図7】
【図8】
【図2】
【図9】
【図11】
【図10】
【図4】
【図5】
【図1】
【図6】
【図7】
【図8】
【図2】
【図9】
【図11】
【図10】
【公開番号】特開平8−44742
【公開日】平成8年(1996)2月16日
【国際特許分類】
【出願番号】特願平6−194702
【出願日】平成6年(1994)7月27日
【出願人】(000000295)沖電気工業株式会社 (6,645)
【公開日】平成8年(1996)2月16日
【国際特許分類】
【出願日】平成6年(1994)7月27日
【出願人】(000000295)沖電気工業株式会社 (6,645)
[ Back to top ]