再生機器、その再生方法およびプログラム
【課題】視覚データと音声データとを組み合わせて視聴できるとともに、その切り替え精度を向上させた再生装置を提供する。
【解決手段】1または複数の視覚データを保持する視覚データベース8と、視覚データの所定部分を規定する部分データと、音声データを保持する音声データベース9と、所定部分に対応するフレーズを規定するフレーズデータと、選択された視覚データおよび音声データをそれぞれ再生するよう制御する制御部6と、を具備し、制御部6は、所定部分が選択された場合には、選択された所定部分に対応するフレーズから選択された音声データを再生する再生装置1,30,60,90としている。
【解決手段】1または複数の視覚データを保持する視覚データベース8と、視覚データの所定部分を規定する部分データと、音声データを保持する音声データベース9と、所定部分に対応するフレーズを規定するフレーズデータと、選択された視覚データおよび音声データをそれぞれ再生するよう制御する制御部6と、を具備し、制御部6は、所定部分が選択された場合には、選択された所定部分に対応するフレーズから選択された音声データを再生する再生装置1,30,60,90としている。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、視覚データと音声データとを組み合わせて視聴可能な再生機器、その再生方法およびプログラムに関する。
【背景技術】
【0002】
動画あるいは静止画等の視覚データと、それに対応する音声データとを組み合わせて視聴する場合がある。たとえば、楽譜を見ながら演奏を聴く、資料を見ながら講演の音声を聞く、あるいは語学テキストを見ながら音声を聞く際等に、視覚データと音声データとを組み合わせて視聴することがある。
【0003】
また、視覚データと音声データとを組み合わせて視聴する場合には、1つの視覚データに対して複数の音声データを切り替えながら視聴したい(たとえば、オーケストラの楽譜を見ながら、オーケストラの音声から各楽器別に演奏された音声に切り替えたい)場合がある。逆に、1つの音声データに対して複数の視覚データを切り替えながら視聴したい(たとえば、オーケストラの演奏を聴きながら、楽譜を全体譜から各楽器別の楽譜に切り替えたい)場合がある。しかしながら、従来は、視覚データと音声データとがひとつになっているため、視覚データのみあるいは音声データのみを変えることができないという問題がある。
【0004】
そこで、視覚データと音声データとを組み合わせて視聴する方法であって、音声データに含まれている特徴点(たとえば、周波数や音量)を分析することにより、その特徴点を視覚データの切り替え基準点として、視覚データの当該特徴点にて切り替える技術が提案されている(たとえば、特許文献1参照。)。特許文献1の発明では、分析で得られた特徴点にて次の視覚データに切り替えることができる。よって、視覚データと音声データとを同期させることができる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平11−69290号公報(図1等)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1の発明は、周波数や音量等を切り替え基準点としているため、音声データに、こぶしをきかせるような音調等が含まれる場合等に特徴点を抽出できず、次の視覚データへ切り替えるタイミングの精度が低下するという問題が生じている。
【0007】
そこで、本発明は、視覚データと音声データとを組み合わせて視聴できるとともに、その切り替え精度を向上させることを目的とする。
【課題を解決するための手段】
【0008】
かかる目的を達成するため、本発明の再生装置の一側面は、動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、その「所定部分」を規定する部分データと、音声データを1または複数保持する音声データベースと、その音声データベースにおいてその「所定部分」に対応するフレーズを規定するフレーズデータと、視覚データまたは音声データを選択する入力部と、選択された視覚データおよび音声データをそれぞれ再生するよう制御する制御部と、を具備し、制御部は、入力部により所定部分が選択された場合には、選択された所定部分に対応するフレーズから選択された音声データを再生するものである。
【0009】
さらに、音声データベースは、複数の音声データを保持し、制御部は、音声データを再生中に、入力部により別の音声データが選択された場合には、音声データの再生中のフレーズに対応するフレーズから、その別の音声データを再生する再生装置であるのが好ましい場合もある。
【0010】
さらに、視覚データベースは、複数の視覚データを複数保持し、制御部は、音声データを再生中に、入力部により別の視覚データが選択された場合には、音声データの再生中のフレーズに対応する部分データを有する別の視覚データを再生する再生装置であるのが好ましい場合もある。
【0011】
さらに、前述の「所定部分」は、動画像または静止画の所定の位置、領域、文字、文字列、数字、記号の場合もある。
【0012】
さらに、制御部は、再生中の前記フレーズに対応する所定部分を表示するカーソルを、視覚データと重ねて表示させる再生装置とするのが好ましい場合もある。
【0013】
また、別の本発明の再生方法の一側面は、かかる目的を達成するため、本発明の再生装置の一側面は、動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、その「所定部分」を規定する部分データと、音声データを1または複数保持する音声データベースと、その音声データベースにおいてその「所定部分」に対応するフレーズを規定するフレーズデータと、視覚データまたは音声データを選択する入力部と、選択された視覚データおよび音声データをそれぞれ再生するよう制御する制御部と、を具備する再生装置において、制御部が、入力部により所定部分が選択された場合には、選択された所定部分に対応するフレーズから、選択された音声データを再生するステップを有する。
【0014】
さらに、音声データを再生中に、入力部により別の音声データが選択された場合には、制御部が、音声データの再生中の上記フレーズに対応するフレーズから別の音声データを再生するステップを有する再生方法が好ましい場合もある。
【0015】
さらに、音声データを再生中に、入力部により別の視覚データが選択された場合には、 制御部が、視覚データの再生中の部分データに対応する部分データを含む別の視覚データを再生するステップを有する再生方法が好ましい場合もある。
【0016】
また、別の本発明のプログラムの一側面は、かかる目的を達成するため、本発明の再生装置の一側面は、動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、その「所定部分」を規定する部分データと、音声データを1または複数保持する音声データベースと、その音声データベースにおいてその「所定部分」に対応するフレーズを規定するフレーズデータと、視覚データまたは音声データを選択する入力部と、選択された視覚データおよび音声データをそれぞれ再生する制御部と、を具備する再生装置において、所定部分に対応するフレーズから音声データを再生するステップをコンピュータに実行させる。
【0017】
さらに、音声データを再生中に、入力部により別の音声データが選択された場合には、制御部が、音声データの再生中のフレーズに対応するフレーズから、その別の音声データを再生するステップをコンピュータに実行させるプログラムとするのが好ましい。
【0018】
さらに、音声データを再生中に、入力部により別の視覚データが選択された場合には、制御部が、音声データの再生中のフレーズに対応するフレーズから別の視覚データを再生するステップをコンピュータに実行させるプログラムとするのが好ましい。
【発明の効果】
【0019】
本発明によれば、視覚データと音声データとを組み合わせて視聴できるとともに、その切り替え精度を向上させた再生装置を提供できる。
【図面の簡単な説明】
【0020】
【図1】本発明の第1の実施の形態に係る再生装置の構成の一例を示すブロック図である。
【図2】第1の実施の形態に係る再生機器の表示部における表示画面の一例を示す平面図である。
【図3】図2の表示部に表示された視覚データのA部分を拡大して示す拡大平面図である。
【図4】図3の視覚データにおける部分データのXMLによる記述の一例を示す図である。
【図5】第1の実施の形態における音声データおよび別の音声データのフレーズの長さおよび構成を説明する説明図である。
【図6】図5の音声データにおけるフレーズデータのXMLによる記述の一例を示す図である。
【図7】第1の実施の形態の再生機器において、視覚データ、部分データ、音声データおよびフレーズデータのひも付けするデータの一例を示すテキストデータである。
【図8】第1の実施の形態に係る再生装置の再生手順を示すフローチャートである。
【図9】第2の実施の形態に係る再生機器が有する視覚データにより表示される静止画を示す平面図である。
【図10】第2の実施の形態に係る再生機器が有するフレーズデータのCSVによる記述の一例を示す図である。
【図11】第2の実施の形態に係る再生機器が有する部分データのCSVによる記述の一例を示す図である。
【図12】第2の実施の形態に係る再生機器が有する音声データのフレーズと時間との関係を示す説明図である。
【図13】第3の実施の形態に係る再生機器が有する視覚データの表示例を示す平面図である。
【図14】第3の実施の形態に係る再生機器が有する音声データのフレーズと、時間との関係を示す説明図である。
【図15】第4の実施の形態に係る再生機器が有する音声データと、時間との関係を示す説明図である。
【発明を実施するための形態】
【0021】
以下、本発明の各実施の形態に係る再生装置、再生方法、および再生プログラムについて説明する。
【0022】
1.第1の実施の形態
(再生装置の構成)
図1は、本発明の第1の実施の形態に係る再生装置1の構成の一例を示すブロック図である。
【0023】
図1に示すように、再生装置1は、記憶部2、入力部3、音声出力部4、表示部5および制御部6を主な構成要素としている。また、記憶部2、入力部3、音声出力部4および表示部5は、制御部6に接続されている。
【0024】
記憶部2は、たとえば、HDD(Hard Disk Drive)あるいはSSD(Solid State drive)等で構成される。この記憶部2には、視覚データベース8および音声データベース9が格納されている。視覚データベース8には、1または複数の視覚データを格納可能であり、音声データベース9には、1または複数の音声データを格納可能である。
【0025】
本明細書において「視覚データ」とは、動画像データあるいは静止画データ等の視覚用のデータをいう。視覚データとしては、たとえば、AVI(Audio Video Interleaving)形式やMOV形式の動画、JPEG(Joint Photographic Experts Group)形式やGIF(Graphic Interchange Format)形式の静止画、地図データ、テキスト形式のファイルデータを用いることができる。各視覚データには、それぞれにファイル名が付され、そのファイル名により、それぞれの視覚データが識別される。また、視覚データは、動画や静止画等を出力するためのデータと、その動画や静止画等の所定部分を規定する部分データとを有している。部分データについては、後で詳述する。
【0026】
本明細書において「音声データ」とは、音楽、音声あるいはその他聴覚用のデータをいう。音声データとしては、たとえば、WAVE形式やAIFF(Audio Interchange File Format)形式のファイルデータを用いることができる。各音声データには、それぞれにファイル名が付され、そのファイル名により各音声データが識別される。音声データは、音声等を出力するためのデータと、音声を所定のフレーズに区切るためのフレーズデータとを有している。フレーズデータは、視覚データの部分データと対応している。フレーズデータについては、後で詳述する。
【0027】
入力部3は、ユーザの操作に対応する情報を生成して、制御部6に当該情報を供給する入力デバイスである。入力部3は、ユーザが再生を所望する1または複数の視覚データ、および、1または複数の音声データのいずれか一方または両方を選択できる。また、入力部3により、ユーザは、視覚データまたは音声データの再生開始位置を選択できる。入力部3としては、たとえば、押しボタン等のメカニカルな入力部材を用いてもよい。また、入力部3は、視覚データと共に画面に表示されるカーソル、アイコンあるいは選択バー等を操作することにより、入力できるものであってもよい。また、たとえば、視覚データの表示に重ねられたタッチパネルを設けて、当該タッチパネルから情報を入力可能としてもよい。
【0028】
音声出力部4は、制御部6より供給された音声データを、人間が聴覚により知覚できる音声等として出力する。具体的には、音声出力部4は、制御部6により供給された音声データをアナログの信号に変換し、その信号を増幅した後、スピーカ等により音声として出力する。
【0029】
表示部5は、制御部6により供給された視覚データおよびその他のデータ等を、人間が視覚により知覚可能な映像として出力する。表示部5としては、たとえば、液晶ディスプレイを用いることができる。
【0030】
制御部6は、演算部6a、記憶部6bおよび計時部6cを主に備え、それらが互いに接続されている。制御部6は、記憶部6bに格納されているプログラム等により、各部を制御する。演算部6aとしては、たとえば、CPU(Central Processing Unit)を用いることができる。記憶部6bは、演算部6aが実行する基本的なプログラムを記憶すると共に、演算部6aが実行対象とするプログラムまたはデータを一時的に格納することができる。記憶部6bは、たとえば、ROM(Read Only Memory)およびRAM(Random Access Memory)等の半導体記憶装置によって構成される。計時部6cは、計時可能な手段により構成され、時刻あるいは時間を演算部6aに供給する。
【0031】
また、制御部6は、視覚効果処理部6dをさらに有していてもよい。視覚効果処理部6dは、記憶部6b等に格納された視覚効果の設定データに従って、制御部6から供給された視覚データに映像効果を施す。ここで、映像効果とは、映像データの切替えの途中段階(トランジション)におけるフェードイン/フェードアウトやディゾルブ等のぼかし効果、静止画の大きさを変えるズーミングや静止画を左右方向(パン)または上下方向(チルト)に振る等の擬似的動画効果等であってもよい。映像効果によって、視覚データの切替え表示を自然に見えるようにし、また、静止画をあたかも動画のように表示することができる。また、視覚効果処理部6dは、制御部6から供給された視覚データに重畳して、いわゆるカーソル7aの表示を行ってもよい。
【0032】
図2は、第1の実施の形態に係る再生機器1の表示部5における表示画面の一例を示す平面図である。
【0033】
図2の表示部5には、視覚データに基づく映像を表示するための表示領域7と、入力部3としての視覚データ選択アイコン3aおよび音声データ選択アイコン3bが配置されている。また、表示領域7に重畳して、カーソル7aが表示されている。
【0034】
表示領域7は、視覚データに基づく映像を視聴するための領域である。視覚データ選択アイコン3aは、表示領域7に表示させる視覚データを選択するためのアイコンである。図2においては、視覚データ選択アイコン3aは、現在選択されている視覚データのファイル名と、選択可能な他の視覚データのファイル名を表示する。なお、視覚データ選択アイコン3aは、入力部3の一部として機能してもよい。入力部3の一部として視覚データ選択アイコン3aが機能する場合には、ポインティングデバイス等を介して、視覚データ選択アイコン3aに表示されている所望のファイル名を選択することで、ユーザは、視覚データを選択できる。
【0035】
音声データ選択アイコン3bは、音声出力部4から出力する音声データを選択するためのアイコンである。図2においては、音声データ選択アイコン3bは、現在選択されている音声データのファイル名と、選択可能な他の音声データのファイル名を表示する。なお、音声データ選択アイコン3bは、入力部3の一部として機能してもよい。入力部3の一部として音声データ選択アイコン3bが機能する場合、たとえば、ポインティングデバイス等を介して、音声データ選択アイコン3bに表示されている所望のファイル名を選択することで、ユーザは、音声データを選択できる。
【0036】
(視覚データの構成)
図3は、図2の表示部5に表示された視覚データ10のA部分を拡大して示す拡大平面図である。図4は、図3の視覚データ10における部分データ11のXML(eXtensible Markup Language)による記述の一例を示す図である。
【0037】
第1の実施の形態においては、再生装置1は、1つの視覚データ10を保持している。また、視覚データ10は、図4に示すようなメタデータにより記述された部分データ11を有する。なお、本実施の形態では、部分データ11は、視覚データ10とは、別のファイルとされているが、視覚データ10の一部に部分データ11が記載されていてもよい。しかし、視覚データ10と部分データ11とが別ファイルとされていることで、視覚データ10に改変を加えることなく本再生方法を実現できるためより好ましい。また、各データが単純化されることから、再生装置の動作が高速化するという利点も有する。
【0038】
部分データ11は、その視覚データ10の所定の一部または全部を規定している。視覚データ10が静止画の場合、部分データ11が規定している「所定の一部」とは、静止画のある所定の領域であってもよい。また、視覚データ10がテキストデータの場合、部分データ11が規定する「所定の一部」とは、所定のテキストまたは所定のテキスト群であってもよい。視覚データ10が楽譜の場合、部分データ11が規定している「所定の一部」とは、規定の小節または所定の小節群であってもよいし、ユーザが任意に設定した長さのまとまりとしてもよい。また、視覚データ10が動画の場合、部分データ11が規定する「所定の一部」とは、再生開始からの相対的な所定の時刻で示される、所定の時間の動画部分であってもよい。
【0039】
図3の範囲において、部分データ11は、楽譜内の各小節を表示する領域10a,10b,10c,10d,10e,10fをそれぞれ規定している。部分データ11は、たとえば、画像左上を(0,0)として、X座標、Y座標、矩形の幅および高さを記述することにより、領域10a〜fに相当する矩形領域をそれぞれ規定している。
【0040】
図4に示すように、部分データ11においては、<Tag>と</Tag>とに挟まれた部分に、各タグの番号が対応する領域10a〜fの範囲が記載されている。たとえば、それぞれの領域10a〜fの幅および高さ、そして、その領域の左上角の座標が記載されている。また、部分データ11は、各領域10a〜fを、タグ番号で識別できるようにしている。たとえば、タグ1として、<1>と</1>との間には、領域10aの範囲が記載されている。このように、領域10aはタグ1、領域10bはタグ2、領域10cはタグ3、領域10dはタグ4、領域10eはタグ5、そして、領域10fはタグ6として記載されている。
【0041】
(音声データの構成)
図5は、第1の実施の形態における音声データ20および別の音声データ22のフレーズ20a,20b,20c,20d,20e,20f,23a,23b,23c,23d,23e,23fの長さおよび構成を説明する説明図である。
【0042】
第1の実施の形態においては、音声データベース3は、2つの音声データ20および音声データ22を有する。ここでは、音声データ20,22は、視覚データ10の楽譜にて演奏されたピアニストAの演奏音声およびピアニストBの演奏音声である。
【0043】
音声データ20は、フレーズデータ21を有し、音声データ22は、フレーズデータ23を有する。フレーズデータ21により、音声データ20のフレーズ20a,20b,20c,20d,20e,20fが規定されている。フレーズデータ23により、音声データ22のフレーズ23a,23b,23c,23d,23e,23fが規定される。フレーズデータ23は、フレーズ20a〜f,23a〜fの先頭相対位置を規定する。フレーズデータ21,23は、たとえば、各フレーズの音声の先頭からの相対的な開始時間(分、秒、百分の一秒)を単位として保持し、また、各フレーズ20a〜f,23a〜fは、タグ付けされている。
【0044】
図6は、図5の音声データ20におけるフレーズデータ21のXMLによる記述の一例を示す図である。
【0045】
図6に示すように、フレーズデータ21においては、<Tag>と</Tag>とに挟まれた部分に、フレーズ20a〜fの先頭からの相対時間が秒にて記載されている。また、各フレーズ20a〜fは、タグ番号により識別可能になっている。たとえば、タグ1として、<1>と</1>との間には、フレーズ20aの先頭相対時間(秒)が記載されている。このように、フレーズ20aはタグ1、フレーズ20bはタグ2、フレーズ20cはタグ3、フレーズ20dはタグ4、フレーズ20eはタグ5、そして、フレーズ20fはタグ6として記載されている。同様に、音声データ22においては、フレーズ22aはタグ1、フレーズ22bはタグ2、フレーズ22cはタグ3、フレーズ22dはタグ4、フレーズ22eはタグ5、そして、フレーズ22fはタグ6として記載されている。
【0046】
また、第1の実施の形態においては、同じタグ番号の部分データ11とフレーズデータ21,23が対応している。具体的には、第1小節目(すなわち領域10a)と対応する音声部分(フレーズ20a,22a)を、フレーズデータ21,23がタグ1として規定している。同様に、第2小節目(すなわち領域10b)と対応する音声部分(フレーズ20b,22b)をタグ3、第3小節目(すなわち領域10c)と対応する音声部分(フレーズ20c,22c)をタグ4、第4小節目(すなわち領域10d)と対応する音声部分(フレーズ20d,22d)をタグ5、第5小節目(すなわち領域10e)と対応する音声部分(フレーズ20e,22e)をタグ6、第6小節目(すなわち領域10f)と対応する音声部分(フレーズ20f,22f)をタグ7として、フレーズデータ21,23と部分データ11とが対応し、同じタグ番号にて識別されている。したがって、部分データ11が有するタグ数と同数のタグを、フレーズデータ21,23が有している。
【0047】
ここで、図4に示すように、演奏された曲自体が一定のテンポを保っているような場合(図4の音声データ20のフレーズ20b〜f)には、各フレーズ20b〜fは、略均一な時間を有することとなる。一方、曲の途中でテンポが変化するような場合(図4の音声データ22)には、各フレーズ22a〜fは、均一な長さとはならない。したがって、音声データ20,22は、共に視覚データ10の領域10a〜dに対応するものではあるが、フレーズ20a〜f,22a〜fの先頭からの相対的な時間が、音声データ20,22毎に異なっている。言い換えると、フレーズデータ21,23は、音声データ20,22毎に異なるものとなる。
【0048】
なお、部分データ11およびフレーズデータ21,23は、XMLにより記述できるが、これに限定されるものではない。たとえば、タグを用いないXML、他のタグ形式、バイナリ形式、CSV(Comma Separated Values)形式などにより実現してもよい。また、各フレーズは、時間以外の単位で記載されていてもよいし、1小節単位で規定されていなくてもよい。
【0049】
図7は、視覚データ10、部分データ11、音声データ20,22およびフレーズデータ21,23のひも付けするデータ24の一例を示すテキストデータである。
【0050】
再生機器1は、視覚データ10、部分データ11、音声データ20,22およびフレーズデータ21,23のひも付けするデータ24をさらに有してもよい。データ24は、音声ファイルの数、ファイル名およびそのフレーズデータのファイル名の記載を有する。また、データ24は、視覚データの数、ファイル名およびその部分データのファイル名を有する。
【0051】
さらに、データ24は、ユーザが再生する音声ファイルと視覚ファイルとを選択するための画面に表示するためのボタン表示用ファイルへのリンクまたはボタンに表示するための文字や数字の記載を有していてもよい。たとえば、データ24には、音声ファイルの再生速度を変えるためのボタンの表示として、「Up」、「Down」の記載を有していてもよい。また、画面に表示させるボタン以外の表示のための記載を有していてもよい。たとえば、ユーザが視覚データ10に書き込みすることを所望する場合、その書き込んだ内容に関してのデータやその図形ファイルへのリンクを有していてもよい。
【0052】
(再生装置の動作)
次に、上述の再生装置1の動作について説明する。
【0053】
図8は、第1の実施の形態における再生装置1の再生手順を示すフローチャートである。
【0054】
まず、制御部6は、データ24を読み込み、それに基づく選択画面を表示部5に表示させる。ユーザは、その選択画面により、入力部3から視覚データおよび音声データを選択できる。
【0055】
制御部6が、入力部3により視覚データあるいは音声データが選択されたことを受信すると、制御部6は、視覚データが選択されたか否かを判断する(ステップS101)。制御部6が、視覚データが選択されたと判断した場合(ステップS101においてYES)、選択された視覚データを視覚データベース8から読み出し、再生し、選択された視覚データに基づく映像を表示部5に表示させる(ステップS102)。具体的には、たとえば、視覚データ10が選択された場合、制御部6は、ステップS101においてYESと判断し、表示部5に視覚データ10に基づく映像を表示させるように制御する。
【0056】
ステップS101において視覚データが選択されていないと制御部6が判断した場合(ステップS101においてNO)、または、ステップS102の後、制御部6は、音声データが選択されたか否かを判断する(ステップS103)。音声データが選択されていない(ステップS103においてYES)と判断した場合、制御部6は、動作を終了し、音声データが選択されるまで待機状態となる。
【0057】
ステップS103において、音声データが選択された(ステップS103においてNO)と判断した場合、次に、制御部6は、音声データを音声データベース9から読み出すと共に、音声データの再生中に別の音声データが選択されたか否かを判断する(ステップS104)。音声データを再生中に別の音声データが選択されたと判断した場合(ステップS104においてYESの場合)、制御部6は、再生中の音声データのフレーズデータ、および選択された音声データのフレーズデータを参照し、再生中のフレーズと対応するフレーズから、選択された音声データを再生する(ステップS105)。たとえば、音声データ20のフレーズ20bを再生中に、音声データ22が選択された場合、制御部6は、ステップS104においてYESと判断する。そして、制御部6は、ステップS105において、フレーズデータ21およびフレーズデータ23を参照し、再生中のフレーズ(タグ2のフレーズ20b)に対応する音声データ22のフレーズ(タグ2のフレーズ22b)から音声データ22の再生を開始し、動作を終了する。
【0058】
ステップS104においてNOの場合、次に、制御部6は、入力部3を介して再生位置が選択されたか否かを判断する(ステップS106)。再生位置が選択されたと判断した場合(ステップS106においてYES)、制御部6は、部分データを参照し、その選択された領域に対応するフレーズから音声データを再生開始する(ステップS107)。たとえば、音声データ20を再生中に、ユーザが入力部4を介して領域10cの領域内を選択した場合、制御部6は、ステップS106においてYESと判断する。そして、ステップS104において制御部6は、領域10cがタグ3にて規定されているので、音声データ20のフレーズデータ21を参照し、タグ3にて規定されているフレーズ20cの開始位置から、音声データ20の再生を開始する。すなわち、領域10cと対応するフレーズ20cから再生を開始できる。
【0059】
一方、制御部6が、再生位置が選択されていないと判断した場合(ステップS106においてNOの場合)、制御部6は、選択された音声データを先頭から再生開始し(ステップS108)、動作を終了する。
【0060】
上述のように、第1の実施の形態にかかる再生装置1では、ユーザは、どの視覚データ10と、どの音声データ20,22とを組み合わせて再生するかを選択できる。また、音声データ20,22の再生位置を周波数分析等することなく検出できるため、再生装置1は、ユーザにより選択された再生位置から素早くかつ精度よく、音声データ20,22を再生できる。
【0061】
また、第1の実施の形態にかかる再生機器1では、視覚データ10を見ながら、再生する音声データ20,22およびその再生位置を指定できる。特に、視覚データ10の領域10a〜fを選択することで、その領域10a〜fと対応するフレーズ20a〜f,22a〜fから再生できるため、視覚的にわかりやすい。また、領域10a〜fと対応するフレーズ20a〜f,22a〜fとは、同じタグ番号が付されていることで、関連付けが容易となる。
【0062】
また、第1の実施の形態に係る再生機器1は、音声データ20,22と視覚データ10とを、部分データ11およびフレーズデータ21,23を参照して同期させることができる。したがって、部分データ11とフレーズデータ21,23が対応つけられていることにより、ある音声データを再生中であっても、スムーズに別の音声データを再生できる。そのため、ある音声データを再生中に別の音声データに切り替えた場合に、巻き戻し、早送り等により対応する再生位置を探す必要がない。そのため、所定のフレーズにおいて、異なる演奏者の演奏を聞き比べたりすることが容易となる。
【0063】
なお、第1の実施の形態においては、ステップS101に〜S102において、まず、視覚データ10を再生するものとしたが、ステップS101〜102のステップは、必須ではない。たとえば、視覚データ10を音声データ20,22と同時または音声データ20,22の出力の後に再生するようにしてもよい。しかし、ステップS101〜102により、視覚データ10を見てから、再生する音声データ20,22を選択できることに加えて、音声データ20,22を選択する前またはその選択と同時に視覚データ10の所定の領域10a〜fを選択できる。
【0064】
また、上述の実施の形態においては、音声データ20,22のいずれかと、視覚データ10とが選択されるとそれらのデータを制御部6が再生するものとしたが、そのような形態に限らない。たとえば、音声データ20,22のいずれかと、視覚データ10との両方が選択されても、予め配置されている再生ボタンにより再生指示が入力されるまでそれらのデータの両方または片方の再生を開始しなくてもよい。また、その再生指示が入力されるまで、音声データ20,22なしで視覚データ10を切り替え可能としてもよい。また、再生機器1が再生停止ボタンを有する場合、再生停止ボタンにより再生停止指示が入力された場合、その停止したフレーズに対応する視覚データ10を切り替えできるようにしてもよい。同様に、その停止したフレーズに対応する別の音声データのフレーズを再生できるようにしてもよい。
【0065】
また、音声データ20,22の再生中に、制御部6の視覚効果処理部6dは、視覚データ10に映像効果処理を行うステップを有していてもよい。また、音声データ20,22の再生中に、制御部6の視覚効果処理部6dは、制御部6から供給された映像データ10に重畳して、いわゆるカーソル7aの表示を行ってもよい。たとえば、視覚効果処理部6dは、部分データ11を参照し、再生中の所定の領域10a〜fに、カーソル7aを表示する処理を行ってもよい。
【0066】
2.第2の実施の形態
次に、本発明の第2の実施の形態に係る再生機器30について説明する。なお、第1の実施の形態に係る再生機器1と同様の構成要素については、同じ符号を付し、説明を省略する。
【0067】
図9は、第2の実施の形態に係る再生機器30が有する視覚データ41,42,43,44により表示される静止画を示す平面図である。
【0068】
第2の実施の形態の再生機器30は、4つの視覚データ41,42,43,44を有する。視覚データ41は、中国語テキストデータであり、中国語を横書きに示す。視覚データ42は、中国語テキストデータであり、中国語を縦書きに示す。視覚データ43は、視覚データ42を漢文として日本語にした日本語テキストデータものであり、縦書きに示す。視覚データ44は、視覚データ21の中国語の発音を英語表記した静止画である。
【0069】
また、4つの視覚データ41〜44は、所定部分としてテキスト群を規定する部分データを有する。たとえば、図8に示すように、部分データにより、視覚データ41のテキスト群41a〜d、視覚データ42のテキスト群42a〜d、視覚データ43のテキスト群43a〜dそして視覚データ44のテキスト群44a〜dが、それぞれ、タグ1〜4として規定されている。
【0070】
図10は、第2の実施の形態に係る再生機器30が有するフレーズデータのCSVによる記述の一例を示す図である。図11は、第2の実施の形態に係る再生機器30が有する部分データのCSVによる記述の一例を示す図である。
【0071】
図10に示すように、音声データ51,52のフレーズデータは、別のCSVファイルに保存されている。たとえば、音声データ51,52のフレーズデータにおいては、選択される言語(図10のlang No.)が記載されている。たとえば、lang No.は、音声データ51(中国語)の場合が「0」であり、音声データ52(日本語)の場合が「1」である。また、フレーズデータには、音声データの先頭からの再生時間に対応した番号(図10のtime No.)、再生する音声データ(図10のstream)および先頭からの再生時間(図10のtime)が記載されている。
【0072】
図11に示すように、視覚データ41〜44の部分データは、CSVによりテーブルとして記載されている。たとえば、視覚データ41〜44の部分データにおいて、選択されている視覚データ41〜44に対応した番号(図11のbook No.)、選択されている言語(図11のlang No.)、先頭からの再生時間と関連づけられた番号(図11のtime No.)およびそれらに関連づけられたテキスト(図11のtext)が記載されている。たとえば、「lang No.」の欄には、音声データ51(中国語)の場合「0」、および音声データ52(日本語)の場合「1」と記載されている。また、「time No.」の欄には、図10のフレーズデータにより先頭からの再生時間と関連づけられた番号が記載されている。また、「text」の欄には、それらのフレーズにひも付けされたテキスト(または、そのテキストを記載したファイルのアドレス)が記載されている。
【0073】
図12は、第2の実施の形態に係る再生機器30が有する音声データ51,52のフレーズ51a〜d,52a〜dと時間との関係を示す説明図である。
【0074】
再生機器30は、2つの音声データ51,52を有する。音声データ51は、視覚データ41および42に記載の中国語を中国語の発音にて発声した音声である。音声データ52は、視覚データ43に記載の中国語を漢文として日本語の発音にて発声した音声である。
【0075】
フレーズデータは、テキスト群41a〜d,42a〜d,43a〜dc,44a〜dにそれぞれ対応する音声データ51のフレーズ51a〜dおよび音声データ52のフレーズ52a〜dを、図12のように規定している。したがって、フレーズ51a,52aは、テキスト群41a,42a,43a,44aにそれぞれ対応している。フレーズ51b,52bは、テキスト群41b,42b,43b,44bにそれぞれ対応している。フレーズ51c,52cは、テキスト群41c,42c,43c,44cにそれぞれ対応している。フレーズ51d,52dは、テキスト群41d,42d,43d,44dにそれぞれ対応している。
【0076】
上述の再生機器30では、視覚データが選択された場合には、制御部6は、フレーズデータにより、その再生中の音声データの種類を示す「lang No.」およびその再生中の音声データの先頭からの再生時間に対応する「time No.」を参照する。そして、制御部6は、選択された視覚データのうち、同じ「lang No.」 および「time No.」を有する視覚データ(Text欄に記載されている)を再生する。同様に、音声データが選択された場合には、制御部6は、フレーズデータを参照し、選択された音声データの「lang No.」を有し、かつ、その再生中の音声データの「time No.」に対応つけられた再生開始位置から、選択された音声データを再生する。
【0077】
上述のような再生機器30を用いることで、ユーザは、所望の視覚データ41〜44と音声データ51,52を組み合わせて再生できる。たとえば、中国語横書きを見ながら中国語の発音を聞きたい場合には、視覚データ41と音声データ51とを、入力部3により選択する。また、中国語の発音を聴きながら、発音の英語表記を見たい場合、入力部3により視覚データ44と音声データ51とを選択する。
【0078】
特に、従来の再生機器では、視覚データと音声データが一つになっているため、所定の視覚データと所定の音声データとの組み合わせの数(本実施例の場合10種類)のデータを必要としたが、本実施例の場合、部分データとフレーズデータとが対応づけられているため、格納するデータを少なくすることができる。また、複数の音声データについて1つのフレーズデータあるいは複数の視覚データについて1つの部分データとすることにより、格納するデータを少なくし、制御部6の処理速度を向上させることができる。また、その視覚データの種類や複雑さなどに応じて、部分データにより規定する所定の領域のかたまりを任意に設定できるため、データを適宜軽くすることができる。
【0079】
3.第3の実施の形態
次に、本発明の第3の実施の形態に係る再生機器60について説明する。なお、第1の実施の形態に係る再生機器1と同様の構成要素については、同じ符号を付し、説明を省略する。
【0080】
図13は、第3の実施の形態に係る再生機器60が有する視覚データ71,72,73,75,76,77の表示例を示す平面図である。
【0081】
再生機器60は、視覚データ71,72,73からなる第1の視覚データ群74と、視覚データ75、76、77からなる第2の視覚データ群78とを有する。また、再生機器60は、1つの音声データ80を有する。
【0082】
視覚データ71,72,73は、いわゆるプレゼンテーションのスライドであり、プレゼンテーションにおいて、視覚データ71、視覚データ72、視覚データ73の順で表示されたスライドである。同様に、視覚データ75,76,77は、プレゼンテーションにおけるスクリプトを文字として示すテキストデータである。視覚データ75,76,77に表示されるテキストは、プレゼンテーションの本番において、視覚データ71,72,73の各スライドを表示した際に読み上げたスクリプトである。
【0083】
再生機器60は、視覚データ71〜77の各視覚データの全部を規定する部分データを有している。たとえば、実施例1に係る再生機器1のように、部分データがXMLにより記述されている場合には、部分データは、<Tag>と</Tag>とに挟まれた部分に、再生すべき視覚データ71〜77のいずれかのファイル名が記載されている。ファイル名の他、その視覚データ75,76,77が属する視覚データ群78のフォルダ名が付されている。
【0084】
図14は、再生機器60が有する音声データ80のフレーズ80a〜cと視覚データ71〜73,75〜77と、時間との関係を示す説明図である。
【0085】
音声データ80は、フレーズデータにより、フレーズ80a,80b、80cが規定されている。フレーズ80aは、視覚データ71,75と対応し、タグ1で規定されている。フレーズ80bは、視覚データ72,76と対応し、タグ2で規定されている。フレーズ80cは、視覚データ73,77と対応し、タグ3で規定されている。
【0086】
次に、再生機器60の動作について説明する。
【0087】
制御部6は、選択された音声データ80と視覚データ71〜73,75〜77のいずれか1つの再生を開始すると共に、計時部6cにより計時を開始する。計時部6cは、次のフレーズ80a〜cの再生開始のタイミングで、次のフレーズ80a〜cと対応つけられている視覚データ71〜73,75〜77であって、同じ視覚データ群74,78に属するものを再生する。たとえば、制御部6は、視覚データ71の再生中には、視覚データ71と対応つけられたフレーズ80a(共にタグ1で規定されている)を再生する。フレーズ80bを再生開始するタイミングでは、視覚データ71が属する視覚データ74に属し、かつ、フレーズ80bと対応つけられた視覚データ72(共にタグ2で規定されている)が再生される。同様に、フレーズ80cを再生開始するタイミングでは、視覚データ73の再生を開始する。視覚データ73は、視覚データ群74に属し、かつ、フレーズ80cと対応つけられている(共にタグ3で規定されている)からである。
【0088】
かかる場合において、入力部3は、視覚データ単位ではなく、視覚データ群単位で選択できてもよい。入力部3により、視覚データ群が選択されると、制御部6は、同じ視覚データ群の視覚データから、部分データを参照する。そして、音声データ80の再生中フレーズを参照し、その再生中のフレーズに対応した所定部分を規定する部分データを有する視覚データを再生する。たとえば、視覚データ72と共に再生中のフレーズがフレーズ81bである場合、制御部6は、視覚データ群78が選択されたことを検出すると、フレーズ61bと対応つけられた視覚データ群78の視覚データ56の再生を開始する。
【0089】
上述のような再生機器60を用いることで、ユーザは、所望の視覚データ71〜73,75〜77と、音声データ80とを組み合わせて、所望の部分から精度よく再生できる。たとえば、プレゼンテーションのスライド(視覚データ71〜73)を見ながらプレゼンテーションの録音音声を聞いている途中に、その音声に対応したスクリプト(視覚データ75〜77)に表示を切り替えることができる。
【0090】
4.第4の実施の形態
次に、本発明の第4の実施の形態に係る再生機器90およびその再生方法について説明する。なお、第1の実施の形態に係る再生機器1と同様の構成要素については、同じ符号を付し、説明を省略する。
【0091】
図15は、再生機器90が有する音声データ95、視覚データ91,92と、時間との関係を示す説明図である。
【0092】
再生機器90は、動画像の視覚データ91、92を有する。視覚データ91は、たとえば、合唱団の全体を撮影した動画であり、視覚データ92は、合唱団の伴奏者を撮影した動画である。
【0093】
また、再生機器90は、1つの音声データ95を有する。音声データ95は、たとえば、合唱団の合唱を収録した音声である。
【0094】
視覚データ91,92は、動画先頭部分からの相対時刻を示す部分データにより、各部分に区切られている。たとえば、視覚データ91、92は、相対時刻が0秒〜10秒の部分91a,92a、相対時刻が10秒01〜15秒の部分91b,92b、相対時刻が15秒01〜25秒の91c,92cの各部分を部分データは、規定している。
【0095】
音声データ95は、フレーズ95a、95b、95cを再生先頭からの相対時刻により規定するフレーズデータを有している。フレーズ95aは、部分91a,92aと対応し、フレーズ95bは、部分91b,92bと対応している、同様に、フレーズ95cは、部分91c,92cと対応している。
【0096】
上述のような再生機器90を用いることで、ユーザは、所望の視覚データ91または92と音声データ95とを組み合わせて精度よく、所望の部分から再生できる。たとえば、録音音声を聞いている際に、合唱団の全体の映像と伴奏者の映像とを自在に切り替えて見ることができる。
【0097】
5.変形例
以上、再生装置1,30,60,90を本発明の実施の形態として説明したが、本発明は、これに限定されるものではなく、発明の要旨を逸脱しない範囲において種々の変形や変更が可能である。
【0098】
たとえば、上述した一連の処理は、プログラムにより実行されるものとしたが、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0099】
制御部6が実行するプログラム、視覚データおよび音声データは、例えば、フレキシブルディスク等の磁気ディスク、CD(Compact Disc)若しくはDVD(Digital Versatile Disc)等の光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブルメディアに記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供されてもよい。
【0100】
制御部6が実行するプログラムは、リムーバブルメディアを介して再生装置1,30,60,90にインストールしてもよいし、有線または無線の伝送媒体を介して、図示せぬ通信部で受信し、記憶部2または記憶部6bに記憶することで再生装置1,30,60,90にインストールしてもよい。
【0101】
なお、再生装置1,30,60,90は、音声出力部4および表示部5を備えるものとしたが、これらは必須ではない。再生装置1,30,60,90自体は、音声出力部4および表示部5を有さずに、音声出力部4および表示部5として機能できる外部機器をインターフェースを介して接続してもよい。たとえば、パーソナルコンピュータを再生装置1,30,60,90として用いて、スピーカやオーディオ等を音声出力部4として接続してもよい。また、表示部5を有していないコンピュータに、表示部5としてテレビ等を接続してもよい。
【0102】
また、再生装置1,30,60,90は、再生のためではなく編集のために用いられる装置、方法あるいはプログラムであってもよい。たとえば、動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、その「所定部分」を規定する部分データと、音声データを1または複数保持する音声データベースと、その音声データベースにおいてその「所定部分」に対応するフレーズを規定するフレーズデータと、視覚データまたは音声データを選択する入力部と、選択された視覚データおよび音声データをそれぞれ再生する制御部と、を具備し、所定部分に対応するフレーズから音声データを再生するステップを実行する装置において、部分データおよびフレーズデータの少なくとも一方に、情報の書き込みを可能とする装置であってもよい。たとえば、再生装置1,30,60,90を用いて、ユーザが所定の部分を設定し部分データに書き込むことができてもよい。また、再生装置1,30,60,90を用いて、ユーザが所定のフレーズを設定し、フレーズデータに書き込むことができてもよい。また、音声データの再生速度、音の強弱等を設定できるようにしてもよい。
【0103】
また、再生装置1,30,60,90は、据え置き式機器、携帯用機器あるいは、カーナビ等の車載用装置など、音声および映像のコンテンツを再生する機能を有する機器であってもよいし、それらに付随可能な装置であってもよい。
【0104】
また、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0105】
また、第3の実施の形態における再生機器60においては、制御部6は、再生中の音声データ80に含まれるフレーズデータに基づき、次に再生するフレーズ80a〜cと対応する視覚データ71〜73,75〜77のいずれかを再生するものとしたが、このような形態に限らない。視覚データが有する部分データに、再生順序についての情報が記載されている場合、制御部6は、再生順序についての情報を読み出し、その再生順序に従って、視覚データベース9に保持された視覚データを順次読み出し、音声データのフレーズデータに基づき、切り替えるようにしてもよい。
【0106】
なお、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラムあるいは、そのプログラムを記憶する記録媒体として捉えてもよい。
【0107】
また、第1の実施の形態においては、1つの視覚データ10と2つの音声データ20,22を有する再生機器1を例示し、第2の実施の形態においては、4つの視覚データ41,42,43,44と2つの音声データ51,52を有する再生機器30を例示した。また、第3の実施の形態においては、2つの視覚データ群74,78と、1つの音声データ80とを有する再生機器60を例示し、第4の実施の形態においては、2つの動画からなる視覚データ91,92と、1つの音性データ93とを有する再生機器90を例示した。しかし、このような形態に限定されない。再生機器1が有する視覚データおよび音声データの数は、いくつであってもよい。また、これらの実施の形態を適宜組み合わせてもよい。たとえば、第1の実施の形態と第4の実施の形態とを組み合わせて、動画からなる視覚データ10と、それに対応する複数の音声データを有する再生機器としてもよい。また、第2の実施の形態と第3の実施の形態とを組み合わせて、複数の視覚データ群と、複数の音声データとを、それぞれ組み合わせることができる再生機器としてもよい。
【0108】
また、上述の各実施の形態においては、1または複数の視覚データから選択された1つの視覚データと、1または複数の音声データから選択された1つの音声データとを合わせて再生するものとしたが、このような形態に限らない。たとえば、表示部5が複数ある、または、表示部5の表示領域7が分割されている場合に、対応する視覚データを2以上出力するようにしてもよい。また、複数の音声データを重ね合わせて(たとえば、トランペットの演奏音声と、ピアノの演奏音声とを重ね合わせて)出力してもよいし、複数の視覚データを重ね合わせて、あるいは、別領域に出力してもよい。さらに、視覚データは、映像や動画の他、音声をさらに有していてもよい。特に、視覚データが動画像データの場合には、映像の他、音声を含む場合が多い。かかる場合には、動画を静止画の集合体に音声が加わったものと考えることができる。そのため、音声を含む視覚データにおいて、時間情報を特徴的に扱ってもよい。さらに、視覚データの音声部分を音声データとして用いてもよい。また、視覚データの音声に、音声データを重ね合わせて出力してもよい。
【0109】
また、上述の各実施の形態においては、ステップS101〜108を行う制御部6としたが、このような形態に限らない。たとえば、ステップS104,S105は、必須ではない。ステップS104,S105を有さない場合、音声データを再生中に別の音声データを再生した場合、ユーザが所定部分を選択しない限り、音声データを最初から再生してもよい。
【産業上の利用可能性】
【0110】
本発明は、たとえば、静止画や動画と音声と合わせて再生可能な再生機器等に適用できる。
【符号の説明】
【0111】
1,
30,60,90 再生装置
2 入力部
6 制御部
7a カーソル
8 視覚データベース
9 音声データベース
10,41,42,43,44,71,72,73,75,76,77,91,92 視覚データ
10a〜f,41a〜f,42a〜f,43a〜f,44a〜f,71,72,73,75,76,77,91a〜c,92a〜c 所定部分
11 部分データ
20,22,51,52,80,95 音声データ
20a〜f,22a〜f,51a〜d,52a〜d,80a〜c,95a〜c フレーズ
21 フレーズデータ
【技術分野】
【0001】
本発明は、視覚データと音声データとを組み合わせて視聴可能な再生機器、その再生方法およびプログラムに関する。
【背景技術】
【0002】
動画あるいは静止画等の視覚データと、それに対応する音声データとを組み合わせて視聴する場合がある。たとえば、楽譜を見ながら演奏を聴く、資料を見ながら講演の音声を聞く、あるいは語学テキストを見ながら音声を聞く際等に、視覚データと音声データとを組み合わせて視聴することがある。
【0003】
また、視覚データと音声データとを組み合わせて視聴する場合には、1つの視覚データに対して複数の音声データを切り替えながら視聴したい(たとえば、オーケストラの楽譜を見ながら、オーケストラの音声から各楽器別に演奏された音声に切り替えたい)場合がある。逆に、1つの音声データに対して複数の視覚データを切り替えながら視聴したい(たとえば、オーケストラの演奏を聴きながら、楽譜を全体譜から各楽器別の楽譜に切り替えたい)場合がある。しかしながら、従来は、視覚データと音声データとがひとつになっているため、視覚データのみあるいは音声データのみを変えることができないという問題がある。
【0004】
そこで、視覚データと音声データとを組み合わせて視聴する方法であって、音声データに含まれている特徴点(たとえば、周波数や音量)を分析することにより、その特徴点を視覚データの切り替え基準点として、視覚データの当該特徴点にて切り替える技術が提案されている(たとえば、特許文献1参照。)。特許文献1の発明では、分析で得られた特徴点にて次の視覚データに切り替えることができる。よって、視覚データと音声データとを同期させることができる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平11−69290号公報(図1等)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1の発明は、周波数や音量等を切り替え基準点としているため、音声データに、こぶしをきかせるような音調等が含まれる場合等に特徴点を抽出できず、次の視覚データへ切り替えるタイミングの精度が低下するという問題が生じている。
【0007】
そこで、本発明は、視覚データと音声データとを組み合わせて視聴できるとともに、その切り替え精度を向上させることを目的とする。
【課題を解決するための手段】
【0008】
かかる目的を達成するため、本発明の再生装置の一側面は、動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、その「所定部分」を規定する部分データと、音声データを1または複数保持する音声データベースと、その音声データベースにおいてその「所定部分」に対応するフレーズを規定するフレーズデータと、視覚データまたは音声データを選択する入力部と、選択された視覚データおよび音声データをそれぞれ再生するよう制御する制御部と、を具備し、制御部は、入力部により所定部分が選択された場合には、選択された所定部分に対応するフレーズから選択された音声データを再生するものである。
【0009】
さらに、音声データベースは、複数の音声データを保持し、制御部は、音声データを再生中に、入力部により別の音声データが選択された場合には、音声データの再生中のフレーズに対応するフレーズから、その別の音声データを再生する再生装置であるのが好ましい場合もある。
【0010】
さらに、視覚データベースは、複数の視覚データを複数保持し、制御部は、音声データを再生中に、入力部により別の視覚データが選択された場合には、音声データの再生中のフレーズに対応する部分データを有する別の視覚データを再生する再生装置であるのが好ましい場合もある。
【0011】
さらに、前述の「所定部分」は、動画像または静止画の所定の位置、領域、文字、文字列、数字、記号の場合もある。
【0012】
さらに、制御部は、再生中の前記フレーズに対応する所定部分を表示するカーソルを、視覚データと重ねて表示させる再生装置とするのが好ましい場合もある。
【0013】
また、別の本発明の再生方法の一側面は、かかる目的を達成するため、本発明の再生装置の一側面は、動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、その「所定部分」を規定する部分データと、音声データを1または複数保持する音声データベースと、その音声データベースにおいてその「所定部分」に対応するフレーズを規定するフレーズデータと、視覚データまたは音声データを選択する入力部と、選択された視覚データおよび音声データをそれぞれ再生するよう制御する制御部と、を具備する再生装置において、制御部が、入力部により所定部分が選択された場合には、選択された所定部分に対応するフレーズから、選択された音声データを再生するステップを有する。
【0014】
さらに、音声データを再生中に、入力部により別の音声データが選択された場合には、制御部が、音声データの再生中の上記フレーズに対応するフレーズから別の音声データを再生するステップを有する再生方法が好ましい場合もある。
【0015】
さらに、音声データを再生中に、入力部により別の視覚データが選択された場合には、 制御部が、視覚データの再生中の部分データに対応する部分データを含む別の視覚データを再生するステップを有する再生方法が好ましい場合もある。
【0016】
また、別の本発明のプログラムの一側面は、かかる目的を達成するため、本発明の再生装置の一側面は、動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、その「所定部分」を規定する部分データと、音声データを1または複数保持する音声データベースと、その音声データベースにおいてその「所定部分」に対応するフレーズを規定するフレーズデータと、視覚データまたは音声データを選択する入力部と、選択された視覚データおよび音声データをそれぞれ再生する制御部と、を具備する再生装置において、所定部分に対応するフレーズから音声データを再生するステップをコンピュータに実行させる。
【0017】
さらに、音声データを再生中に、入力部により別の音声データが選択された場合には、制御部が、音声データの再生中のフレーズに対応するフレーズから、その別の音声データを再生するステップをコンピュータに実行させるプログラムとするのが好ましい。
【0018】
さらに、音声データを再生中に、入力部により別の視覚データが選択された場合には、制御部が、音声データの再生中のフレーズに対応するフレーズから別の視覚データを再生するステップをコンピュータに実行させるプログラムとするのが好ましい。
【発明の効果】
【0019】
本発明によれば、視覚データと音声データとを組み合わせて視聴できるとともに、その切り替え精度を向上させた再生装置を提供できる。
【図面の簡単な説明】
【0020】
【図1】本発明の第1の実施の形態に係る再生装置の構成の一例を示すブロック図である。
【図2】第1の実施の形態に係る再生機器の表示部における表示画面の一例を示す平面図である。
【図3】図2の表示部に表示された視覚データのA部分を拡大して示す拡大平面図である。
【図4】図3の視覚データにおける部分データのXMLによる記述の一例を示す図である。
【図5】第1の実施の形態における音声データおよび別の音声データのフレーズの長さおよび構成を説明する説明図である。
【図6】図5の音声データにおけるフレーズデータのXMLによる記述の一例を示す図である。
【図7】第1の実施の形態の再生機器において、視覚データ、部分データ、音声データおよびフレーズデータのひも付けするデータの一例を示すテキストデータである。
【図8】第1の実施の形態に係る再生装置の再生手順を示すフローチャートである。
【図9】第2の実施の形態に係る再生機器が有する視覚データにより表示される静止画を示す平面図である。
【図10】第2の実施の形態に係る再生機器が有するフレーズデータのCSVによる記述の一例を示す図である。
【図11】第2の実施の形態に係る再生機器が有する部分データのCSVによる記述の一例を示す図である。
【図12】第2の実施の形態に係る再生機器が有する音声データのフレーズと時間との関係を示す説明図である。
【図13】第3の実施の形態に係る再生機器が有する視覚データの表示例を示す平面図である。
【図14】第3の実施の形態に係る再生機器が有する音声データのフレーズと、時間との関係を示す説明図である。
【図15】第4の実施の形態に係る再生機器が有する音声データと、時間との関係を示す説明図である。
【発明を実施するための形態】
【0021】
以下、本発明の各実施の形態に係る再生装置、再生方法、および再生プログラムについて説明する。
【0022】
1.第1の実施の形態
(再生装置の構成)
図1は、本発明の第1の実施の形態に係る再生装置1の構成の一例を示すブロック図である。
【0023】
図1に示すように、再生装置1は、記憶部2、入力部3、音声出力部4、表示部5および制御部6を主な構成要素としている。また、記憶部2、入力部3、音声出力部4および表示部5は、制御部6に接続されている。
【0024】
記憶部2は、たとえば、HDD(Hard Disk Drive)あるいはSSD(Solid State drive)等で構成される。この記憶部2には、視覚データベース8および音声データベース9が格納されている。視覚データベース8には、1または複数の視覚データを格納可能であり、音声データベース9には、1または複数の音声データを格納可能である。
【0025】
本明細書において「視覚データ」とは、動画像データあるいは静止画データ等の視覚用のデータをいう。視覚データとしては、たとえば、AVI(Audio Video Interleaving)形式やMOV形式の動画、JPEG(Joint Photographic Experts Group)形式やGIF(Graphic Interchange Format)形式の静止画、地図データ、テキスト形式のファイルデータを用いることができる。各視覚データには、それぞれにファイル名が付され、そのファイル名により、それぞれの視覚データが識別される。また、視覚データは、動画や静止画等を出力するためのデータと、その動画や静止画等の所定部分を規定する部分データとを有している。部分データについては、後で詳述する。
【0026】
本明細書において「音声データ」とは、音楽、音声あるいはその他聴覚用のデータをいう。音声データとしては、たとえば、WAVE形式やAIFF(Audio Interchange File Format)形式のファイルデータを用いることができる。各音声データには、それぞれにファイル名が付され、そのファイル名により各音声データが識別される。音声データは、音声等を出力するためのデータと、音声を所定のフレーズに区切るためのフレーズデータとを有している。フレーズデータは、視覚データの部分データと対応している。フレーズデータについては、後で詳述する。
【0027】
入力部3は、ユーザの操作に対応する情報を生成して、制御部6に当該情報を供給する入力デバイスである。入力部3は、ユーザが再生を所望する1または複数の視覚データ、および、1または複数の音声データのいずれか一方または両方を選択できる。また、入力部3により、ユーザは、視覚データまたは音声データの再生開始位置を選択できる。入力部3としては、たとえば、押しボタン等のメカニカルな入力部材を用いてもよい。また、入力部3は、視覚データと共に画面に表示されるカーソル、アイコンあるいは選択バー等を操作することにより、入力できるものであってもよい。また、たとえば、視覚データの表示に重ねられたタッチパネルを設けて、当該タッチパネルから情報を入力可能としてもよい。
【0028】
音声出力部4は、制御部6より供給された音声データを、人間が聴覚により知覚できる音声等として出力する。具体的には、音声出力部4は、制御部6により供給された音声データをアナログの信号に変換し、その信号を増幅した後、スピーカ等により音声として出力する。
【0029】
表示部5は、制御部6により供給された視覚データおよびその他のデータ等を、人間が視覚により知覚可能な映像として出力する。表示部5としては、たとえば、液晶ディスプレイを用いることができる。
【0030】
制御部6は、演算部6a、記憶部6bおよび計時部6cを主に備え、それらが互いに接続されている。制御部6は、記憶部6bに格納されているプログラム等により、各部を制御する。演算部6aとしては、たとえば、CPU(Central Processing Unit)を用いることができる。記憶部6bは、演算部6aが実行する基本的なプログラムを記憶すると共に、演算部6aが実行対象とするプログラムまたはデータを一時的に格納することができる。記憶部6bは、たとえば、ROM(Read Only Memory)およびRAM(Random Access Memory)等の半導体記憶装置によって構成される。計時部6cは、計時可能な手段により構成され、時刻あるいは時間を演算部6aに供給する。
【0031】
また、制御部6は、視覚効果処理部6dをさらに有していてもよい。視覚効果処理部6dは、記憶部6b等に格納された視覚効果の設定データに従って、制御部6から供給された視覚データに映像効果を施す。ここで、映像効果とは、映像データの切替えの途中段階(トランジション)におけるフェードイン/フェードアウトやディゾルブ等のぼかし効果、静止画の大きさを変えるズーミングや静止画を左右方向(パン)または上下方向(チルト)に振る等の擬似的動画効果等であってもよい。映像効果によって、視覚データの切替え表示を自然に見えるようにし、また、静止画をあたかも動画のように表示することができる。また、視覚効果処理部6dは、制御部6から供給された視覚データに重畳して、いわゆるカーソル7aの表示を行ってもよい。
【0032】
図2は、第1の実施の形態に係る再生機器1の表示部5における表示画面の一例を示す平面図である。
【0033】
図2の表示部5には、視覚データに基づく映像を表示するための表示領域7と、入力部3としての視覚データ選択アイコン3aおよび音声データ選択アイコン3bが配置されている。また、表示領域7に重畳して、カーソル7aが表示されている。
【0034】
表示領域7は、視覚データに基づく映像を視聴するための領域である。視覚データ選択アイコン3aは、表示領域7に表示させる視覚データを選択するためのアイコンである。図2においては、視覚データ選択アイコン3aは、現在選択されている視覚データのファイル名と、選択可能な他の視覚データのファイル名を表示する。なお、視覚データ選択アイコン3aは、入力部3の一部として機能してもよい。入力部3の一部として視覚データ選択アイコン3aが機能する場合には、ポインティングデバイス等を介して、視覚データ選択アイコン3aに表示されている所望のファイル名を選択することで、ユーザは、視覚データを選択できる。
【0035】
音声データ選択アイコン3bは、音声出力部4から出力する音声データを選択するためのアイコンである。図2においては、音声データ選択アイコン3bは、現在選択されている音声データのファイル名と、選択可能な他の音声データのファイル名を表示する。なお、音声データ選択アイコン3bは、入力部3の一部として機能してもよい。入力部3の一部として音声データ選択アイコン3bが機能する場合、たとえば、ポインティングデバイス等を介して、音声データ選択アイコン3bに表示されている所望のファイル名を選択することで、ユーザは、音声データを選択できる。
【0036】
(視覚データの構成)
図3は、図2の表示部5に表示された視覚データ10のA部分を拡大して示す拡大平面図である。図4は、図3の視覚データ10における部分データ11のXML(eXtensible Markup Language)による記述の一例を示す図である。
【0037】
第1の実施の形態においては、再生装置1は、1つの視覚データ10を保持している。また、視覚データ10は、図4に示すようなメタデータにより記述された部分データ11を有する。なお、本実施の形態では、部分データ11は、視覚データ10とは、別のファイルとされているが、視覚データ10の一部に部分データ11が記載されていてもよい。しかし、視覚データ10と部分データ11とが別ファイルとされていることで、視覚データ10に改変を加えることなく本再生方法を実現できるためより好ましい。また、各データが単純化されることから、再生装置の動作が高速化するという利点も有する。
【0038】
部分データ11は、その視覚データ10の所定の一部または全部を規定している。視覚データ10が静止画の場合、部分データ11が規定している「所定の一部」とは、静止画のある所定の領域であってもよい。また、視覚データ10がテキストデータの場合、部分データ11が規定する「所定の一部」とは、所定のテキストまたは所定のテキスト群であってもよい。視覚データ10が楽譜の場合、部分データ11が規定している「所定の一部」とは、規定の小節または所定の小節群であってもよいし、ユーザが任意に設定した長さのまとまりとしてもよい。また、視覚データ10が動画の場合、部分データ11が規定する「所定の一部」とは、再生開始からの相対的な所定の時刻で示される、所定の時間の動画部分であってもよい。
【0039】
図3の範囲において、部分データ11は、楽譜内の各小節を表示する領域10a,10b,10c,10d,10e,10fをそれぞれ規定している。部分データ11は、たとえば、画像左上を(0,0)として、X座標、Y座標、矩形の幅および高さを記述することにより、領域10a〜fに相当する矩形領域をそれぞれ規定している。
【0040】
図4に示すように、部分データ11においては、<Tag>と</Tag>とに挟まれた部分に、各タグの番号が対応する領域10a〜fの範囲が記載されている。たとえば、それぞれの領域10a〜fの幅および高さ、そして、その領域の左上角の座標が記載されている。また、部分データ11は、各領域10a〜fを、タグ番号で識別できるようにしている。たとえば、タグ1として、<1>と</1>との間には、領域10aの範囲が記載されている。このように、領域10aはタグ1、領域10bはタグ2、領域10cはタグ3、領域10dはタグ4、領域10eはタグ5、そして、領域10fはタグ6として記載されている。
【0041】
(音声データの構成)
図5は、第1の実施の形態における音声データ20および別の音声データ22のフレーズ20a,20b,20c,20d,20e,20f,23a,23b,23c,23d,23e,23fの長さおよび構成を説明する説明図である。
【0042】
第1の実施の形態においては、音声データベース3は、2つの音声データ20および音声データ22を有する。ここでは、音声データ20,22は、視覚データ10の楽譜にて演奏されたピアニストAの演奏音声およびピアニストBの演奏音声である。
【0043】
音声データ20は、フレーズデータ21を有し、音声データ22は、フレーズデータ23を有する。フレーズデータ21により、音声データ20のフレーズ20a,20b,20c,20d,20e,20fが規定されている。フレーズデータ23により、音声データ22のフレーズ23a,23b,23c,23d,23e,23fが規定される。フレーズデータ23は、フレーズ20a〜f,23a〜fの先頭相対位置を規定する。フレーズデータ21,23は、たとえば、各フレーズの音声の先頭からの相対的な開始時間(分、秒、百分の一秒)を単位として保持し、また、各フレーズ20a〜f,23a〜fは、タグ付けされている。
【0044】
図6は、図5の音声データ20におけるフレーズデータ21のXMLによる記述の一例を示す図である。
【0045】
図6に示すように、フレーズデータ21においては、<Tag>と</Tag>とに挟まれた部分に、フレーズ20a〜fの先頭からの相対時間が秒にて記載されている。また、各フレーズ20a〜fは、タグ番号により識別可能になっている。たとえば、タグ1として、<1>と</1>との間には、フレーズ20aの先頭相対時間(秒)が記載されている。このように、フレーズ20aはタグ1、フレーズ20bはタグ2、フレーズ20cはタグ3、フレーズ20dはタグ4、フレーズ20eはタグ5、そして、フレーズ20fはタグ6として記載されている。同様に、音声データ22においては、フレーズ22aはタグ1、フレーズ22bはタグ2、フレーズ22cはタグ3、フレーズ22dはタグ4、フレーズ22eはタグ5、そして、フレーズ22fはタグ6として記載されている。
【0046】
また、第1の実施の形態においては、同じタグ番号の部分データ11とフレーズデータ21,23が対応している。具体的には、第1小節目(すなわち領域10a)と対応する音声部分(フレーズ20a,22a)を、フレーズデータ21,23がタグ1として規定している。同様に、第2小節目(すなわち領域10b)と対応する音声部分(フレーズ20b,22b)をタグ3、第3小節目(すなわち領域10c)と対応する音声部分(フレーズ20c,22c)をタグ4、第4小節目(すなわち領域10d)と対応する音声部分(フレーズ20d,22d)をタグ5、第5小節目(すなわち領域10e)と対応する音声部分(フレーズ20e,22e)をタグ6、第6小節目(すなわち領域10f)と対応する音声部分(フレーズ20f,22f)をタグ7として、フレーズデータ21,23と部分データ11とが対応し、同じタグ番号にて識別されている。したがって、部分データ11が有するタグ数と同数のタグを、フレーズデータ21,23が有している。
【0047】
ここで、図4に示すように、演奏された曲自体が一定のテンポを保っているような場合(図4の音声データ20のフレーズ20b〜f)には、各フレーズ20b〜fは、略均一な時間を有することとなる。一方、曲の途中でテンポが変化するような場合(図4の音声データ22)には、各フレーズ22a〜fは、均一な長さとはならない。したがって、音声データ20,22は、共に視覚データ10の領域10a〜dに対応するものではあるが、フレーズ20a〜f,22a〜fの先頭からの相対的な時間が、音声データ20,22毎に異なっている。言い換えると、フレーズデータ21,23は、音声データ20,22毎に異なるものとなる。
【0048】
なお、部分データ11およびフレーズデータ21,23は、XMLにより記述できるが、これに限定されるものではない。たとえば、タグを用いないXML、他のタグ形式、バイナリ形式、CSV(Comma Separated Values)形式などにより実現してもよい。また、各フレーズは、時間以外の単位で記載されていてもよいし、1小節単位で規定されていなくてもよい。
【0049】
図7は、視覚データ10、部分データ11、音声データ20,22およびフレーズデータ21,23のひも付けするデータ24の一例を示すテキストデータである。
【0050】
再生機器1は、視覚データ10、部分データ11、音声データ20,22およびフレーズデータ21,23のひも付けするデータ24をさらに有してもよい。データ24は、音声ファイルの数、ファイル名およびそのフレーズデータのファイル名の記載を有する。また、データ24は、視覚データの数、ファイル名およびその部分データのファイル名を有する。
【0051】
さらに、データ24は、ユーザが再生する音声ファイルと視覚ファイルとを選択するための画面に表示するためのボタン表示用ファイルへのリンクまたはボタンに表示するための文字や数字の記載を有していてもよい。たとえば、データ24には、音声ファイルの再生速度を変えるためのボタンの表示として、「Up」、「Down」の記載を有していてもよい。また、画面に表示させるボタン以外の表示のための記載を有していてもよい。たとえば、ユーザが視覚データ10に書き込みすることを所望する場合、その書き込んだ内容に関してのデータやその図形ファイルへのリンクを有していてもよい。
【0052】
(再生装置の動作)
次に、上述の再生装置1の動作について説明する。
【0053】
図8は、第1の実施の形態における再生装置1の再生手順を示すフローチャートである。
【0054】
まず、制御部6は、データ24を読み込み、それに基づく選択画面を表示部5に表示させる。ユーザは、その選択画面により、入力部3から視覚データおよび音声データを選択できる。
【0055】
制御部6が、入力部3により視覚データあるいは音声データが選択されたことを受信すると、制御部6は、視覚データが選択されたか否かを判断する(ステップS101)。制御部6が、視覚データが選択されたと判断した場合(ステップS101においてYES)、選択された視覚データを視覚データベース8から読み出し、再生し、選択された視覚データに基づく映像を表示部5に表示させる(ステップS102)。具体的には、たとえば、視覚データ10が選択された場合、制御部6は、ステップS101においてYESと判断し、表示部5に視覚データ10に基づく映像を表示させるように制御する。
【0056】
ステップS101において視覚データが選択されていないと制御部6が判断した場合(ステップS101においてNO)、または、ステップS102の後、制御部6は、音声データが選択されたか否かを判断する(ステップS103)。音声データが選択されていない(ステップS103においてYES)と判断した場合、制御部6は、動作を終了し、音声データが選択されるまで待機状態となる。
【0057】
ステップS103において、音声データが選択された(ステップS103においてNO)と判断した場合、次に、制御部6は、音声データを音声データベース9から読み出すと共に、音声データの再生中に別の音声データが選択されたか否かを判断する(ステップS104)。音声データを再生中に別の音声データが選択されたと判断した場合(ステップS104においてYESの場合)、制御部6は、再生中の音声データのフレーズデータ、および選択された音声データのフレーズデータを参照し、再生中のフレーズと対応するフレーズから、選択された音声データを再生する(ステップS105)。たとえば、音声データ20のフレーズ20bを再生中に、音声データ22が選択された場合、制御部6は、ステップS104においてYESと判断する。そして、制御部6は、ステップS105において、フレーズデータ21およびフレーズデータ23を参照し、再生中のフレーズ(タグ2のフレーズ20b)に対応する音声データ22のフレーズ(タグ2のフレーズ22b)から音声データ22の再生を開始し、動作を終了する。
【0058】
ステップS104においてNOの場合、次に、制御部6は、入力部3を介して再生位置が選択されたか否かを判断する(ステップS106)。再生位置が選択されたと判断した場合(ステップS106においてYES)、制御部6は、部分データを参照し、その選択された領域に対応するフレーズから音声データを再生開始する(ステップS107)。たとえば、音声データ20を再生中に、ユーザが入力部4を介して領域10cの領域内を選択した場合、制御部6は、ステップS106においてYESと判断する。そして、ステップS104において制御部6は、領域10cがタグ3にて規定されているので、音声データ20のフレーズデータ21を参照し、タグ3にて規定されているフレーズ20cの開始位置から、音声データ20の再生を開始する。すなわち、領域10cと対応するフレーズ20cから再生を開始できる。
【0059】
一方、制御部6が、再生位置が選択されていないと判断した場合(ステップS106においてNOの場合)、制御部6は、選択された音声データを先頭から再生開始し(ステップS108)、動作を終了する。
【0060】
上述のように、第1の実施の形態にかかる再生装置1では、ユーザは、どの視覚データ10と、どの音声データ20,22とを組み合わせて再生するかを選択できる。また、音声データ20,22の再生位置を周波数分析等することなく検出できるため、再生装置1は、ユーザにより選択された再生位置から素早くかつ精度よく、音声データ20,22を再生できる。
【0061】
また、第1の実施の形態にかかる再生機器1では、視覚データ10を見ながら、再生する音声データ20,22およびその再生位置を指定できる。特に、視覚データ10の領域10a〜fを選択することで、その領域10a〜fと対応するフレーズ20a〜f,22a〜fから再生できるため、視覚的にわかりやすい。また、領域10a〜fと対応するフレーズ20a〜f,22a〜fとは、同じタグ番号が付されていることで、関連付けが容易となる。
【0062】
また、第1の実施の形態に係る再生機器1は、音声データ20,22と視覚データ10とを、部分データ11およびフレーズデータ21,23を参照して同期させることができる。したがって、部分データ11とフレーズデータ21,23が対応つけられていることにより、ある音声データを再生中であっても、スムーズに別の音声データを再生できる。そのため、ある音声データを再生中に別の音声データに切り替えた場合に、巻き戻し、早送り等により対応する再生位置を探す必要がない。そのため、所定のフレーズにおいて、異なる演奏者の演奏を聞き比べたりすることが容易となる。
【0063】
なお、第1の実施の形態においては、ステップS101に〜S102において、まず、視覚データ10を再生するものとしたが、ステップS101〜102のステップは、必須ではない。たとえば、視覚データ10を音声データ20,22と同時または音声データ20,22の出力の後に再生するようにしてもよい。しかし、ステップS101〜102により、視覚データ10を見てから、再生する音声データ20,22を選択できることに加えて、音声データ20,22を選択する前またはその選択と同時に視覚データ10の所定の領域10a〜fを選択できる。
【0064】
また、上述の実施の形態においては、音声データ20,22のいずれかと、視覚データ10とが選択されるとそれらのデータを制御部6が再生するものとしたが、そのような形態に限らない。たとえば、音声データ20,22のいずれかと、視覚データ10との両方が選択されても、予め配置されている再生ボタンにより再生指示が入力されるまでそれらのデータの両方または片方の再生を開始しなくてもよい。また、その再生指示が入力されるまで、音声データ20,22なしで視覚データ10を切り替え可能としてもよい。また、再生機器1が再生停止ボタンを有する場合、再生停止ボタンにより再生停止指示が入力された場合、その停止したフレーズに対応する視覚データ10を切り替えできるようにしてもよい。同様に、その停止したフレーズに対応する別の音声データのフレーズを再生できるようにしてもよい。
【0065】
また、音声データ20,22の再生中に、制御部6の視覚効果処理部6dは、視覚データ10に映像効果処理を行うステップを有していてもよい。また、音声データ20,22の再生中に、制御部6の視覚効果処理部6dは、制御部6から供給された映像データ10に重畳して、いわゆるカーソル7aの表示を行ってもよい。たとえば、視覚効果処理部6dは、部分データ11を参照し、再生中の所定の領域10a〜fに、カーソル7aを表示する処理を行ってもよい。
【0066】
2.第2の実施の形態
次に、本発明の第2の実施の形態に係る再生機器30について説明する。なお、第1の実施の形態に係る再生機器1と同様の構成要素については、同じ符号を付し、説明を省略する。
【0067】
図9は、第2の実施の形態に係る再生機器30が有する視覚データ41,42,43,44により表示される静止画を示す平面図である。
【0068】
第2の実施の形態の再生機器30は、4つの視覚データ41,42,43,44を有する。視覚データ41は、中国語テキストデータであり、中国語を横書きに示す。視覚データ42は、中国語テキストデータであり、中国語を縦書きに示す。視覚データ43は、視覚データ42を漢文として日本語にした日本語テキストデータものであり、縦書きに示す。視覚データ44は、視覚データ21の中国語の発音を英語表記した静止画である。
【0069】
また、4つの視覚データ41〜44は、所定部分としてテキスト群を規定する部分データを有する。たとえば、図8に示すように、部分データにより、視覚データ41のテキスト群41a〜d、視覚データ42のテキスト群42a〜d、視覚データ43のテキスト群43a〜dそして視覚データ44のテキスト群44a〜dが、それぞれ、タグ1〜4として規定されている。
【0070】
図10は、第2の実施の形態に係る再生機器30が有するフレーズデータのCSVによる記述の一例を示す図である。図11は、第2の実施の形態に係る再生機器30が有する部分データのCSVによる記述の一例を示す図である。
【0071】
図10に示すように、音声データ51,52のフレーズデータは、別のCSVファイルに保存されている。たとえば、音声データ51,52のフレーズデータにおいては、選択される言語(図10のlang No.)が記載されている。たとえば、lang No.は、音声データ51(中国語)の場合が「0」であり、音声データ52(日本語)の場合が「1」である。また、フレーズデータには、音声データの先頭からの再生時間に対応した番号(図10のtime No.)、再生する音声データ(図10のstream)および先頭からの再生時間(図10のtime)が記載されている。
【0072】
図11に示すように、視覚データ41〜44の部分データは、CSVによりテーブルとして記載されている。たとえば、視覚データ41〜44の部分データにおいて、選択されている視覚データ41〜44に対応した番号(図11のbook No.)、選択されている言語(図11のlang No.)、先頭からの再生時間と関連づけられた番号(図11のtime No.)およびそれらに関連づけられたテキスト(図11のtext)が記載されている。たとえば、「lang No.」の欄には、音声データ51(中国語)の場合「0」、および音声データ52(日本語)の場合「1」と記載されている。また、「time No.」の欄には、図10のフレーズデータにより先頭からの再生時間と関連づけられた番号が記載されている。また、「text」の欄には、それらのフレーズにひも付けされたテキスト(または、そのテキストを記載したファイルのアドレス)が記載されている。
【0073】
図12は、第2の実施の形態に係る再生機器30が有する音声データ51,52のフレーズ51a〜d,52a〜dと時間との関係を示す説明図である。
【0074】
再生機器30は、2つの音声データ51,52を有する。音声データ51は、視覚データ41および42に記載の中国語を中国語の発音にて発声した音声である。音声データ52は、視覚データ43に記載の中国語を漢文として日本語の発音にて発声した音声である。
【0075】
フレーズデータは、テキスト群41a〜d,42a〜d,43a〜dc,44a〜dにそれぞれ対応する音声データ51のフレーズ51a〜dおよび音声データ52のフレーズ52a〜dを、図12のように規定している。したがって、フレーズ51a,52aは、テキスト群41a,42a,43a,44aにそれぞれ対応している。フレーズ51b,52bは、テキスト群41b,42b,43b,44bにそれぞれ対応している。フレーズ51c,52cは、テキスト群41c,42c,43c,44cにそれぞれ対応している。フレーズ51d,52dは、テキスト群41d,42d,43d,44dにそれぞれ対応している。
【0076】
上述の再生機器30では、視覚データが選択された場合には、制御部6は、フレーズデータにより、その再生中の音声データの種類を示す「lang No.」およびその再生中の音声データの先頭からの再生時間に対応する「time No.」を参照する。そして、制御部6は、選択された視覚データのうち、同じ「lang No.」 および「time No.」を有する視覚データ(Text欄に記載されている)を再生する。同様に、音声データが選択された場合には、制御部6は、フレーズデータを参照し、選択された音声データの「lang No.」を有し、かつ、その再生中の音声データの「time No.」に対応つけられた再生開始位置から、選択された音声データを再生する。
【0077】
上述のような再生機器30を用いることで、ユーザは、所望の視覚データ41〜44と音声データ51,52を組み合わせて再生できる。たとえば、中国語横書きを見ながら中国語の発音を聞きたい場合には、視覚データ41と音声データ51とを、入力部3により選択する。また、中国語の発音を聴きながら、発音の英語表記を見たい場合、入力部3により視覚データ44と音声データ51とを選択する。
【0078】
特に、従来の再生機器では、視覚データと音声データが一つになっているため、所定の視覚データと所定の音声データとの組み合わせの数(本実施例の場合10種類)のデータを必要としたが、本実施例の場合、部分データとフレーズデータとが対応づけられているため、格納するデータを少なくすることができる。また、複数の音声データについて1つのフレーズデータあるいは複数の視覚データについて1つの部分データとすることにより、格納するデータを少なくし、制御部6の処理速度を向上させることができる。また、その視覚データの種類や複雑さなどに応じて、部分データにより規定する所定の領域のかたまりを任意に設定できるため、データを適宜軽くすることができる。
【0079】
3.第3の実施の形態
次に、本発明の第3の実施の形態に係る再生機器60について説明する。なお、第1の実施の形態に係る再生機器1と同様の構成要素については、同じ符号を付し、説明を省略する。
【0080】
図13は、第3の実施の形態に係る再生機器60が有する視覚データ71,72,73,75,76,77の表示例を示す平面図である。
【0081】
再生機器60は、視覚データ71,72,73からなる第1の視覚データ群74と、視覚データ75、76、77からなる第2の視覚データ群78とを有する。また、再生機器60は、1つの音声データ80を有する。
【0082】
視覚データ71,72,73は、いわゆるプレゼンテーションのスライドであり、プレゼンテーションにおいて、視覚データ71、視覚データ72、視覚データ73の順で表示されたスライドである。同様に、視覚データ75,76,77は、プレゼンテーションにおけるスクリプトを文字として示すテキストデータである。視覚データ75,76,77に表示されるテキストは、プレゼンテーションの本番において、視覚データ71,72,73の各スライドを表示した際に読み上げたスクリプトである。
【0083】
再生機器60は、視覚データ71〜77の各視覚データの全部を規定する部分データを有している。たとえば、実施例1に係る再生機器1のように、部分データがXMLにより記述されている場合には、部分データは、<Tag>と</Tag>とに挟まれた部分に、再生すべき視覚データ71〜77のいずれかのファイル名が記載されている。ファイル名の他、その視覚データ75,76,77が属する視覚データ群78のフォルダ名が付されている。
【0084】
図14は、再生機器60が有する音声データ80のフレーズ80a〜cと視覚データ71〜73,75〜77と、時間との関係を示す説明図である。
【0085】
音声データ80は、フレーズデータにより、フレーズ80a,80b、80cが規定されている。フレーズ80aは、視覚データ71,75と対応し、タグ1で規定されている。フレーズ80bは、視覚データ72,76と対応し、タグ2で規定されている。フレーズ80cは、視覚データ73,77と対応し、タグ3で規定されている。
【0086】
次に、再生機器60の動作について説明する。
【0087】
制御部6は、選択された音声データ80と視覚データ71〜73,75〜77のいずれか1つの再生を開始すると共に、計時部6cにより計時を開始する。計時部6cは、次のフレーズ80a〜cの再生開始のタイミングで、次のフレーズ80a〜cと対応つけられている視覚データ71〜73,75〜77であって、同じ視覚データ群74,78に属するものを再生する。たとえば、制御部6は、視覚データ71の再生中には、視覚データ71と対応つけられたフレーズ80a(共にタグ1で規定されている)を再生する。フレーズ80bを再生開始するタイミングでは、視覚データ71が属する視覚データ74に属し、かつ、フレーズ80bと対応つけられた視覚データ72(共にタグ2で規定されている)が再生される。同様に、フレーズ80cを再生開始するタイミングでは、視覚データ73の再生を開始する。視覚データ73は、視覚データ群74に属し、かつ、フレーズ80cと対応つけられている(共にタグ3で規定されている)からである。
【0088】
かかる場合において、入力部3は、視覚データ単位ではなく、視覚データ群単位で選択できてもよい。入力部3により、視覚データ群が選択されると、制御部6は、同じ視覚データ群の視覚データから、部分データを参照する。そして、音声データ80の再生中フレーズを参照し、その再生中のフレーズに対応した所定部分を規定する部分データを有する視覚データを再生する。たとえば、視覚データ72と共に再生中のフレーズがフレーズ81bである場合、制御部6は、視覚データ群78が選択されたことを検出すると、フレーズ61bと対応つけられた視覚データ群78の視覚データ56の再生を開始する。
【0089】
上述のような再生機器60を用いることで、ユーザは、所望の視覚データ71〜73,75〜77と、音声データ80とを組み合わせて、所望の部分から精度よく再生できる。たとえば、プレゼンテーションのスライド(視覚データ71〜73)を見ながらプレゼンテーションの録音音声を聞いている途中に、その音声に対応したスクリプト(視覚データ75〜77)に表示を切り替えることができる。
【0090】
4.第4の実施の形態
次に、本発明の第4の実施の形態に係る再生機器90およびその再生方法について説明する。なお、第1の実施の形態に係る再生機器1と同様の構成要素については、同じ符号を付し、説明を省略する。
【0091】
図15は、再生機器90が有する音声データ95、視覚データ91,92と、時間との関係を示す説明図である。
【0092】
再生機器90は、動画像の視覚データ91、92を有する。視覚データ91は、たとえば、合唱団の全体を撮影した動画であり、視覚データ92は、合唱団の伴奏者を撮影した動画である。
【0093】
また、再生機器90は、1つの音声データ95を有する。音声データ95は、たとえば、合唱団の合唱を収録した音声である。
【0094】
視覚データ91,92は、動画先頭部分からの相対時刻を示す部分データにより、各部分に区切られている。たとえば、視覚データ91、92は、相対時刻が0秒〜10秒の部分91a,92a、相対時刻が10秒01〜15秒の部分91b,92b、相対時刻が15秒01〜25秒の91c,92cの各部分を部分データは、規定している。
【0095】
音声データ95は、フレーズ95a、95b、95cを再生先頭からの相対時刻により規定するフレーズデータを有している。フレーズ95aは、部分91a,92aと対応し、フレーズ95bは、部分91b,92bと対応している、同様に、フレーズ95cは、部分91c,92cと対応している。
【0096】
上述のような再生機器90を用いることで、ユーザは、所望の視覚データ91または92と音声データ95とを組み合わせて精度よく、所望の部分から再生できる。たとえば、録音音声を聞いている際に、合唱団の全体の映像と伴奏者の映像とを自在に切り替えて見ることができる。
【0097】
5.変形例
以上、再生装置1,30,60,90を本発明の実施の形態として説明したが、本発明は、これに限定されるものではなく、発明の要旨を逸脱しない範囲において種々の変形や変更が可能である。
【0098】
たとえば、上述した一連の処理は、プログラムにより実行されるものとしたが、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0099】
制御部6が実行するプログラム、視覚データおよび音声データは、例えば、フレキシブルディスク等の磁気ディスク、CD(Compact Disc)若しくはDVD(Digital Versatile Disc)等の光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブルメディアに記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供されてもよい。
【0100】
制御部6が実行するプログラムは、リムーバブルメディアを介して再生装置1,30,60,90にインストールしてもよいし、有線または無線の伝送媒体を介して、図示せぬ通信部で受信し、記憶部2または記憶部6bに記憶することで再生装置1,30,60,90にインストールしてもよい。
【0101】
なお、再生装置1,30,60,90は、音声出力部4および表示部5を備えるものとしたが、これらは必須ではない。再生装置1,30,60,90自体は、音声出力部4および表示部5を有さずに、音声出力部4および表示部5として機能できる外部機器をインターフェースを介して接続してもよい。たとえば、パーソナルコンピュータを再生装置1,30,60,90として用いて、スピーカやオーディオ等を音声出力部4として接続してもよい。また、表示部5を有していないコンピュータに、表示部5としてテレビ等を接続してもよい。
【0102】
また、再生装置1,30,60,90は、再生のためではなく編集のために用いられる装置、方法あるいはプログラムであってもよい。たとえば、動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、その「所定部分」を規定する部分データと、音声データを1または複数保持する音声データベースと、その音声データベースにおいてその「所定部分」に対応するフレーズを規定するフレーズデータと、視覚データまたは音声データを選択する入力部と、選択された視覚データおよび音声データをそれぞれ再生する制御部と、を具備し、所定部分に対応するフレーズから音声データを再生するステップを実行する装置において、部分データおよびフレーズデータの少なくとも一方に、情報の書き込みを可能とする装置であってもよい。たとえば、再生装置1,30,60,90を用いて、ユーザが所定の部分を設定し部分データに書き込むことができてもよい。また、再生装置1,30,60,90を用いて、ユーザが所定のフレーズを設定し、フレーズデータに書き込むことができてもよい。また、音声データの再生速度、音の強弱等を設定できるようにしてもよい。
【0103】
また、再生装置1,30,60,90は、据え置き式機器、携帯用機器あるいは、カーナビ等の車載用装置など、音声および映像のコンテンツを再生する機能を有する機器であってもよいし、それらに付随可能な装置であってもよい。
【0104】
また、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0105】
また、第3の実施の形態における再生機器60においては、制御部6は、再生中の音声データ80に含まれるフレーズデータに基づき、次に再生するフレーズ80a〜cと対応する視覚データ71〜73,75〜77のいずれかを再生するものとしたが、このような形態に限らない。視覚データが有する部分データに、再生順序についての情報が記載されている場合、制御部6は、再生順序についての情報を読み出し、その再生順序に従って、視覚データベース9に保持された視覚データを順次読み出し、音声データのフレーズデータに基づき、切り替えるようにしてもよい。
【0106】
なお、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラムあるいは、そのプログラムを記憶する記録媒体として捉えてもよい。
【0107】
また、第1の実施の形態においては、1つの視覚データ10と2つの音声データ20,22を有する再生機器1を例示し、第2の実施の形態においては、4つの視覚データ41,42,43,44と2つの音声データ51,52を有する再生機器30を例示した。また、第3の実施の形態においては、2つの視覚データ群74,78と、1つの音声データ80とを有する再生機器60を例示し、第4の実施の形態においては、2つの動画からなる視覚データ91,92と、1つの音性データ93とを有する再生機器90を例示した。しかし、このような形態に限定されない。再生機器1が有する視覚データおよび音声データの数は、いくつであってもよい。また、これらの実施の形態を適宜組み合わせてもよい。たとえば、第1の実施の形態と第4の実施の形態とを組み合わせて、動画からなる視覚データ10と、それに対応する複数の音声データを有する再生機器としてもよい。また、第2の実施の形態と第3の実施の形態とを組み合わせて、複数の視覚データ群と、複数の音声データとを、それぞれ組み合わせることができる再生機器としてもよい。
【0108】
また、上述の各実施の形態においては、1または複数の視覚データから選択された1つの視覚データと、1または複数の音声データから選択された1つの音声データとを合わせて再生するものとしたが、このような形態に限らない。たとえば、表示部5が複数ある、または、表示部5の表示領域7が分割されている場合に、対応する視覚データを2以上出力するようにしてもよい。また、複数の音声データを重ね合わせて(たとえば、トランペットの演奏音声と、ピアノの演奏音声とを重ね合わせて)出力してもよいし、複数の視覚データを重ね合わせて、あるいは、別領域に出力してもよい。さらに、視覚データは、映像や動画の他、音声をさらに有していてもよい。特に、視覚データが動画像データの場合には、映像の他、音声を含む場合が多い。かかる場合には、動画を静止画の集合体に音声が加わったものと考えることができる。そのため、音声を含む視覚データにおいて、時間情報を特徴的に扱ってもよい。さらに、視覚データの音声部分を音声データとして用いてもよい。また、視覚データの音声に、音声データを重ね合わせて出力してもよい。
【0109】
また、上述の各実施の形態においては、ステップS101〜108を行う制御部6としたが、このような形態に限らない。たとえば、ステップS104,S105は、必須ではない。ステップS104,S105を有さない場合、音声データを再生中に別の音声データを再生した場合、ユーザが所定部分を選択しない限り、音声データを最初から再生してもよい。
【産業上の利用可能性】
【0110】
本発明は、たとえば、静止画や動画と音声と合わせて再生可能な再生機器等に適用できる。
【符号の説明】
【0111】
1,
30,60,90 再生装置
2 入力部
6 制御部
7a カーソル
8 視覚データベース
9 音声データベース
10,41,42,43,44,71,72,73,75,76,77,91,92 視覚データ
10a〜f,41a〜f,42a〜f,43a〜f,44a〜f,71,72,73,75,76,77,91a〜c,92a〜c 所定部分
11 部分データ
20,22,51,52,80,95 音声データ
20a〜f,22a〜f,51a〜d,52a〜d,80a〜c,95a〜c フレーズ
21 フレーズデータ
【特許請求の範囲】
【請求項1】
動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、
上記視覚データの所定部分を規定する部分データと、
音声データを1または複数保持する音声データベースと、
上記音声データにおける上記所定部分に対応するフレーズを規定するフレーズデータと、
上記視覚データまたは上記音声データを選択する入力部と、
選択された上記視覚データおよび上記音声データをそれぞれ再生するよう制御する制御部と、を具備し、
上記制御部は、上記入力部により上記所定部分が選択された場合には、選択された上記所定部分に対応するフレーズから、選択された上記音声データを再生することを特徴とする再生装置。
【請求項2】
請求項1に記載の再生装置であって、
前記音声データベースは、複数の前記音声データを保持し、
前記制御部は、前記音声データを再生中に、前記入力部により別の音声データが選択された場合には、前記音声データの再生中の前記フレーズに対応する前記フレーズから当該別の音声データを再生することを特徴とする再生装置。
【請求項3】
請求項1または請求項2に記載の再生装置であって、
前記視覚データベースは、複数の前記視覚データを複数保持し、
前記制御部は、前記音声データを再生中に、前記入力部により別の視覚データが選択された場合には、前記音声データの再生中の前記フレーズに対応する前記部分データを有する当該別の視覚データを再生することを特徴とする再生装置。
【請求項4】
請求項1から請求項3のいずれか1項に記載の再生装置であって、
前記所定部分は、動画像または静止画の所定の位置、領域、文字、文字列、数字、記号であることを特徴とする再生装置。
【請求項5】
請求項1から請求項4のいずれか1項に記載の再生装置であって、
前記制御部は、再生中の前記フレーズに対応する前記所定部分を表示するカーソルを、前記視覚データと重ねて表示させることを特徴とする再生装置。
【請求項6】
動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、
上記視覚データの所定部分を規定する部分データと、
音声データを1または複数保持する音声データベースと、
上記音声データベースにおいて上記所定部分に対応するフレーズを規定するフレーズデータと、
上記視覚データまたは上記音声データを選択する入力部と、
選択された上記視覚データおよび上記音声データをそれぞれ再生するよう制御する制御部と、を具備する再生装置において、
上記制御部が、上記入力部により上記所定部分が選択された場合には、選択された上記所定部分に対応する上記フレーズから、選択された上記音声データを再生するステップを有することを特徴とする再生方法。
【請求項7】
請求項6に記載の再生方法であって、
前記音声データを再生中に、前記入力部により別の音声データが選択された場合には、前記制御部が、前記音声データの再生中の上記フレーズに対応する上記フレーズから上記別の音声データを再生するステップを、さらに有することを特徴とする再生方法。
【請求項8】
請求項6または請求項7に記載の再生方法であって、
前記音声データを再生中に、前記入力部により別の視覚データが選択された場合には、
前記制御部が、前記視覚データの再生中の上記部分データに対応する上記部分データを含む上記別の視覚データを再生するステップを、さらに有することを特徴とする再生方法。
【請求項9】
動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、
上記視覚データの所定部分を規定する部分データと、
音声データを1または複数保持する音声データベースと、
上記音声データベースにおいて上記所定部分に対応するフレーズを規定するフレーズデータと、
上記視覚データまたは上記音声データを選択する入力部と、
選択された上記視覚データおよび上記音声データをそれぞれ再生する制御部と、を具備する再生装置において、
上記所定部分に対応する上記フレーズから上記音声データを再生するステップをコンピュータに実行させることを特徴とするプログラム。
【請求項10】
請求項9に記載のプログラムにおいて、
前記音声データを再生中に、前記入力部により別の音声データが選択された場合には、前記制御部が、前記音声データの再生中の前記フレーズに対応する前記フレーズから上記別の音声データを再生するステップをコンピュータに実行させることを特徴とするプログラム。
【請求項11】
請求項9または請求項10に記載のプログラムにおいて、
前記音声データを再生中に、前記入力部により別の前記視覚データが選択された場合には、前記制御部が、前記音声データの再生中の前記フレーズに対応する前記フレーズから上記別の視覚データを再生するステップをコンピュータに実行させることを特徴とするプログラム。
【請求項1】
動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、
上記視覚データの所定部分を規定する部分データと、
音声データを1または複数保持する音声データベースと、
上記音声データにおける上記所定部分に対応するフレーズを規定するフレーズデータと、
上記視覚データまたは上記音声データを選択する入力部と、
選択された上記視覚データおよび上記音声データをそれぞれ再生するよう制御する制御部と、を具備し、
上記制御部は、上記入力部により上記所定部分が選択された場合には、選択された上記所定部分に対応するフレーズから、選択された上記音声データを再生することを特徴とする再生装置。
【請求項2】
請求項1に記載の再生装置であって、
前記音声データベースは、複数の前記音声データを保持し、
前記制御部は、前記音声データを再生中に、前記入力部により別の音声データが選択された場合には、前記音声データの再生中の前記フレーズに対応する前記フレーズから当該別の音声データを再生することを特徴とする再生装置。
【請求項3】
請求項1または請求項2に記載の再生装置であって、
前記視覚データベースは、複数の前記視覚データを複数保持し、
前記制御部は、前記音声データを再生中に、前記入力部により別の視覚データが選択された場合には、前記音声データの再生中の前記フレーズに対応する前記部分データを有する当該別の視覚データを再生することを特徴とする再生装置。
【請求項4】
請求項1から請求項3のいずれか1項に記載の再生装置であって、
前記所定部分は、動画像または静止画の所定の位置、領域、文字、文字列、数字、記号であることを特徴とする再生装置。
【請求項5】
請求項1から請求項4のいずれか1項に記載の再生装置であって、
前記制御部は、再生中の前記フレーズに対応する前記所定部分を表示するカーソルを、前記視覚データと重ねて表示させることを特徴とする再生装置。
【請求項6】
動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、
上記視覚データの所定部分を規定する部分データと、
音声データを1または複数保持する音声データベースと、
上記音声データベースにおいて上記所定部分に対応するフレーズを規定するフレーズデータと、
上記視覚データまたは上記音声データを選択する入力部と、
選択された上記視覚データおよび上記音声データをそれぞれ再生するよう制御する制御部と、を具備する再生装置において、
上記制御部が、上記入力部により上記所定部分が選択された場合には、選択された上記所定部分に対応する上記フレーズから、選択された上記音声データを再生するステップを有することを特徴とする再生方法。
【請求項7】
請求項6に記載の再生方法であって、
前記音声データを再生中に、前記入力部により別の音声データが選択された場合には、前記制御部が、前記音声データの再生中の上記フレーズに対応する上記フレーズから上記別の音声データを再生するステップを、さらに有することを特徴とする再生方法。
【請求項8】
請求項6または請求項7に記載の再生方法であって、
前記音声データを再生中に、前記入力部により別の視覚データが選択された場合には、
前記制御部が、前記視覚データの再生中の上記部分データに対応する上記部分データを含む上記別の視覚データを再生するステップを、さらに有することを特徴とする再生方法。
【請求項9】
動画像データ若しくは静止画データを1または複数の視覚データとして保持する視覚データベースと、
上記視覚データの所定部分を規定する部分データと、
音声データを1または複数保持する音声データベースと、
上記音声データベースにおいて上記所定部分に対応するフレーズを規定するフレーズデータと、
上記視覚データまたは上記音声データを選択する入力部と、
選択された上記視覚データおよび上記音声データをそれぞれ再生する制御部と、を具備する再生装置において、
上記所定部分に対応する上記フレーズから上記音声データを再生するステップをコンピュータに実行させることを特徴とするプログラム。
【請求項10】
請求項9に記載のプログラムにおいて、
前記音声データを再生中に、前記入力部により別の音声データが選択された場合には、前記制御部が、前記音声データの再生中の前記フレーズに対応する前記フレーズから上記別の音声データを再生するステップをコンピュータに実行させることを特徴とするプログラム。
【請求項11】
請求項9または請求項10に記載のプログラムにおいて、
前記音声データを再生中に、前記入力部により別の前記視覚データが選択された場合には、前記制御部が、前記音声データの再生中の前記フレーズに対応する前記フレーズから上記別の視覚データを再生するステップをコンピュータに実行させることを特徴とするプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2013−73650(P2013−73650A)
【公開日】平成25年4月22日(2013.4.22)
【国際特許分類】
【出願番号】特願2011−211690(P2011−211690)
【出願日】平成23年9月27日(2011.9.27)
【出願人】(511233979)
【出願人】(711010806)
【Fターム(参考)】
【公開日】平成25年4月22日(2013.4.22)
【国際特許分類】
【出願日】平成23年9月27日(2011.9.27)
【出願人】(511233979)
【出願人】(711010806)
【Fターム(参考)】
[ Back to top ]