説明

音響再生装置

【課題】音響データの再生に応じて、特定の効果を発生させる。
【解決手段】本発明の音響再生装置は、音響データの再生に応じて、効果を発生する音響再生装置であって、任意の音響データにおける印象またはタイミングを表す音響表現を取得する音響解析部30−1と、前記取得した音響表現に応じた効果を任意の出力に付与する効果付与部30−3と、前記音響データおよび前記効果を付与した出力を再生するディスプレイ10と、を備えることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響データの再生に応じて、特定の効果を発生する音響再生装置に関する。
【背景技術】
【0002】
従来から、写真などの画像を閲覧するために、アルバムやデジタルフォトフレームが用いられている。また、ユーザが好みの音楽を再生しながら、画面に写真を表示する技術も提案されている。例えば、特許文献1には、変化に富む多様な音楽表現の楽曲を生成するとともに、楽曲の演奏時間を自由に変更し、時間的に変化する各種の事象に対応した楽曲の生成を行なう技術が開示されている。この技術では、電話番号、名前、スケジュールなどのデータや情報に基づいて音楽を生成し、音楽データに埋め込まれたイベントデータによって映像を変化させて再生する。具体的には、メロディ(主旋律)についてはメロディフレーズテーブルが用意されており、メロディ以外のジャンルやテンポ、キーなどについては、アレンジメント(伴奏)テーブルが用意されている。メロディフレーズテーブルから電話番号などに対応して選択した複数のメロディフレーズと、所望のアレンジメント要素とを拡張フレーズを用いながら合成することで、音楽表現の豊かな楽曲を生成する。
【0003】
また、特許文献2には、再生リストファイルを含むデータ構造が提案されており、静止画像とオーディオデータを共にスライドショーとして再生する。この技術では、記録媒体に記録される再生リストファイルは、静止画像とオーディオデータを共にスライドショーとして再生するためのナビゲーション情報を有する再生リストファイルを含む。このナビゲーション情報は、静止画像のプレゼンテーションとオーディオデータの再生とを同期させるために静止画像と、オーディオデータとを関連付ける。さらに、ナビゲーション情報は、オーディオデータの再生が静止画像のプレゼンテーションとは独立して行なわれるようにするために静止画像とオーディオデータとを関連付けている。
【0004】
また、特許文献3には、音楽に対する印象に対応する画像を自動で選択しつつ、ユーザの好みに調整された画像を表示する技術が開示されている。この技術では、音楽の印象と画像の印象を自動で判定し、この判定に従って、音楽を再生する際の画像を自動で選択して表示する。具体的には、音楽を再生する際に、予め記憶されている音楽の印象を取得し、その音楽の印象に対応する印象を有する画像を、選択して画像表示部に表示する。このように選択され、画像表示部に表示している画像に対して加えられた使用者の操作情報を記憶し、画像を選択する際に反映する。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2005−352425号公報
【特許文献2】特表2005−538481号公報
【特許文献3】特開2010−210746号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1に開示されている技術では、イベントデータを音楽データに埋め込む必要があるため、音楽データを完成途中や完成状態ではなく、初めから生成する場合に限られてしまう。このため、利用者が手間を省きたい場合や好みの音楽を再生したい場合などのように、既存の音楽を再生する場合は、この技術を使うことができない。
【0007】
また、特許文献2に開示されている技術では、ナビゲーション情報を用いるが、この情報は、利用者またはシステムが予め指定しておく必要がある。さらに、ナビゲーション情報は、静止制御毎に指定しなければならないため、その作業は膨大な量になってしまう。また、特許文献3に開示されている技術では、音楽の印象語が楽曲単位で割り当てられており、同一楽曲では異なる印象を連続的に表示することは困難である。一方、印象の異なる画像を連続的に表示する場合は、画像毎に楽曲を切り替えなければならないという課題がある。
【0008】
本発明は、このような事情に鑑みてなされたものであり、音響データの再生に応じて、特定の効果を発生させることができる音響再生装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
(1)上記の目的を達成するために、本発明は、以下のような手段を講じた。すなわち、本発明の音響再生装置は、音響データの再生に応じて、効果を発生する音響再生装置であって、任意の音響データにおける印象またはタイミングを表す音響表現を取得する表現取得部と、前記取得した音響表現に応じた効果を任意の出力に付与する効果付与部と、前記音響データおよび前記効果を付与した出力を再生する効果再生部と、を備えることを特徴とする。
【0010】
このように、任意の音響データにおける印象またはタイミングを表す音響表現を取得し、前記取得した音響表現に応じた効果を任意の出力に付与し、前記音響データおよび前記効果を付与した出力を再生するので、市販の音楽などの既存の音響コンテンツを利用することができ、また、音響表現に応じた効果を出力するので、効果を付与するための作業をする必要がなくなる。
【0011】
(2)また、本発明の音響再生装置において、前記効果付与部は、前記取得した音響表現に応じた視覚効果を画像に付与し、前記効果再生部は、前記音響データおよび前記視覚効果を付与した画像を再生することを特徴とする。
【0012】
このように、取得した音響表現に応じた視覚効果を画像に付与し、音響データおよび視覚効果を付与した画像を再生するので、市販の音楽などの既存の音響コンテンツを利用することができ、また、音響表現に応じた視覚効果を出力するので、効果を付与するための作業をする必要がなくなる。さらに、同一楽曲内の局所的な変化に応じて効果を付与することによって、楽曲を切り替えることなく印象の異なる画像を連続的に表現することが可能となる。
【0013】
(3)また、本発明の音響再生装置において、前記表現取得部は、音階を示す情報または分散和音を示す情報を含む任意の音型情報、または、音圧レベルを示す情報またはビート位置を示す情報を含む任意の同期情報における所定時間の変化に基づいて、前記音型情報または前記同期情報における音響表現を抽出する表現抽出部を備えることを特徴とする。
【0014】
このように、音階を示す情報または分散和音を示す情報を含む任意の音型情報、または、音圧レベルを示す情報またはビート位置を示す情報を含む任意の同期情報における所定時間の変化に基づいて、前記音型情報または前記同期情報における音響表現を抽出するので、既存の音響データから音響表現を出力することが可能となる。例えば、市販の音楽データなどの既存の音響コンテンツを利用することができる。
【0015】
(4)また、本発明の音響再生装置は、任意の音響データを読み取り、前記音響データにおける任意の音響特徴量を解析し、前記音響特徴量に基づいて、前記音型情報または前記同期情報を抽出する音響解析部を備えることを特徴とする。
【0016】
このように、任意の音響データを読み取り、前記音響データにおける任意の音響特徴量を解析し、前記音響特徴量に基づいて、前記音型情報または前記同期情報を抽出するので、入力し得るあらゆる音響データを対象とし、音響表現を得ることが可能となる。
【0017】
(5)また、本発明の音響再生装置は、前記音型情報または前記同期情報が記録された媒体を計算機またはスキャナで読み取り、前記音型情報または前記同期情報を抽出する音響解析部、を備えることを特徴とする。
【0018】
このように、音型情報または前記同期情報が記録された媒体を計算機またはスキャナで読み取り、前記音型情報または前記同期情報を抽出するので、信号化できるあらゆる音響データを対象とし、音響表現を得ることが可能となる。
【0019】
(6)また、本発明の音響再生装置において、前記効果再生部は、前記音響データを再生し、前記視覚効果を付与した画像を画面に表示することを特徴とする。
【0020】
このように、音響データを再生し、視覚効果を付与した画像を画面に表示するので、音響データを視覚的に表現することが可能となる。この場合、音響表現を示すデータを自動的に出力するので、ユーザは予め作業をする必要はない。
【0021】
(7)また、本発明の音響再生装置において、前記音響データは、コンピュータファイル、光学メディア、または磁気メディアのいずれかであることを特徴とする。
【0022】
このように、音響データは、コンピュータファイル、光学メディア、または磁気メディアのいずれかであるので、あらゆる音響データを対象とし、音響表現を得ることが可能となる。
【0023】
(8)また、本発明の音響再生装置において、前記媒体は、MIDI、楽譜、または歌詞のいずれかであることを特徴とする。
【0024】
このように、媒体は、MIDI、楽譜、または歌詞のいずれかであるので、あらゆるオーディオデータを対象とし、音響表現を得ることが可能となる。
【0025】
(9)また、本発明の音響再生装置において、前記画面は、スクリーン、ディスプレイ、テレビ、ビルの壁面、窓、ガラス、鏡、またはパネルのいずれかであることを特徴とする。
【0026】
このように、画面は、スクリーン、ディスプレイ、テレビ、ビルの壁面、窓、ガラス、鏡、またはパネルのいずれかであるので、あらゆる画面に音響表現を表示することが可能となる。また、音響データの再生に合わせて音響表現を自動的に付与することによって、予め作業は必要としない。さらに、同一楽曲内の局所的な変化に応じて音響表現を付与すれば、楽曲を切り替えることなく、印象の異なる音響表現を表示することが可能である。
【発明の効果】
【0027】
本発明によれば、任意の音響データにおける印象またはタイミングを表す音響表現を取得し、前記取得した音響表現に応じた効果を任意の出力に付与し、前記音響データおよび前記効果を付与した出力を再生するので、市販の音楽などの既存の音響コンテンツを利用することができ、また、音響表現に応じた効果を出力するので、効果を付与するための作業をする必要がなくなる。
【図面の簡単な説明】
【0028】
【図1】本実施形態に係るマルチメディアシステムの概略構成を示す図である。
【図2】本実施形態に係るマルチメディアシステム1の機能を示すブロック図である。
【図3】本実施形態に係るマルチメディアシステム1の動作を示すフローチャートである。
【発明を実施するための形態】
【0029】
本発明の実施形態に係る音響再生装置は、入力される音楽データから音響特徴量を解析し、解析した音響特徴量における任意時間内の変化に基づいて、音楽の表現を抽出する。そして、抽出した表現に応じた視覚効果を入力される写真データに付与し、視覚効果を付与した写真データをディスプレイに表示する。この構成により、市販の音楽などの既存の音楽コンテンツを利用することが可能となる。また、音楽データの再生に合わせて視覚効果を自動的に画像に付与するので、効果付与のための作業を予めする必要がない。さらに、同一楽曲内の局所的な変化に応じて視覚効果を付与することによって、楽曲を切り替えることなく、印象の異なる画像を連続的に表示することが可能となる。以下、本発明に係る音響再生装置を、マルチメディアシステムに適用した例を説明する。
【0030】
本発明の実施形態に係るマルチメディアシステムでは、入力として、画像を利用する。画像とは、動画・静止画のいずれをも含む概念である。本実施形態では、写真データを利用する例を説明するが、本発明は、写真データに限定されるわけではない。
【0031】
本発明の実施形態に係るマルチメディアシステムでは、入力として、音響信号を利用する。音響信号とは、いずれの音波を含む概念であるが、好ましくは、音楽データを利用する。本実施形態では、一例として、音楽データを用いた例を示すが、本発明の技術的思想は、音楽データに限定されるわけではない。さらに、本発明の実施形態に係るマルチメディアシステムでは、入力される音楽データの音響特徴量の解析にspecmurt法を利用する。本明細書では、一例として、specmurt法を示すが、本発明の技術的思想は、specmurt法に限定されるわけではない。
【0032】
図1は、本実施形態に係るマルチメディアシステムの概略構成を示す図である。図1に示すように、マルチメディアシステムは、ディスプレイ10と、スピーカ20a、20bと、PC(Personal Computer)30と、から構成されている。図1では、2つのスピーカ20a、20bが、ディスプレイ10の両脇に設けられている。また、PC30には、写真データ40と音楽データ50が入力される。
【0033】
PC30は、ケーブル30aを介して映写装置としてのディスプレイ10に接続されている。また、PC30は、ケーブル30bを介して音響装置としてのスピーカ20に接続されている。PC30は、入力される音楽データ50から音響特徴量を解析し、解析した音響特徴量における任意時間内の変化に基づいて音楽の表現を抽出する。この抽出した表現に応じた視覚効果を、入力される写真データ40に付与する。そして、PC30は、視覚効果を付与した写真データ40の画像信号をディスプレイ10に発信すると共に、音楽データ50の音響信号をスピーカ20に発信する。その際、PC30において視覚効果が付与された写真データ40はディスプレイ10にA1として映写され、音楽データ50はスピーカ20からA2として放射される。
【0034】
図2は、本実施形態に係るマルチメディアシステム1の機能を示すブロック図である。PC30の音響解析部30−1は、入力される音楽データ50から音響特徴量を解析する。また、PC30の表現抽出部30−2は、音響解析部30−1が解析した音響特徴量における任意時間内の変化に基づいて音楽の表現を抽出する。さらに、PC30の効果付与部30−3は、表現抽出部30−2が抽出した表現に応じた視覚効果を写真データ40に付与する。その他の構成については、図1で説明したとおりであるため、説明を省略する。
【0035】
図3は、本実施形態に係るマルチメディアシステム1の動作を示すフローチャートである。初めに、PC30に、写真データ40と音楽データ50を入力する(ステップS1)。次に、PC30において、入力された音楽データ50の対数周波数スペクトルを獲得する(ステップS2)。まず、時刻tにおける音楽データ50の入力信号をI(t)とする時、式(1)に基づいて、帯域xのサブバンド信号Bx(t)を算出する。
【0036】
【数1】

式(1)において、gt(t)はガンマトーンフィルタのインパルス応答、Sはスケールパラメータである。ここで、中心周波数fHzのガンマトーンフィルタのインパルス応答は、式(2)で与えられる。
【0037】
【数2】

式(2)において、nはフィルタの次元数でbはインパルス応答の長さ、つまりフィルタのバンド幅に関係するパラメータである。人間の聴覚フィルタを想定した場合、n=4、b=1.019ERB(f)とすれば良い。ただし,ERB(f)は中心周波数がfHzである等価方形幅(ERB:Equivalent Rectangular Bandwidth)を表しており、式(3)で算出される。
【0038】
【数3】

以上のように、算出されたサブバンド信号B(t)から、式(4)で示される対数周波数スペクトルv(x)を得る。
【0039】
【数4】

次に、PC30において、入力された音楽データ50の共通調波構造パターンを獲得する(ステップS3)。まず、単一音の性質として、その基本周波数に依らず対数周波数軸上の倍音の強度の比のパターンは一定であると仮定する。これを共通調波構造パターンと呼び、対数基本周波数を原点に取ってh(x)と表すことにする。モノラル音楽音響信号の場合、h(x)は周波数に反比例するので、式(5)で表わすことができる。
【0040】
【数5】

ここで、h(x)は基本周波数に相当する位置を原点とし、基本波成分エネルギーを1(h(0)=1)とする。一方、異なる基本周波数の単一音xα、xβが重畳した多重音の場合は、対数周波数軸上にこれら異なる基本周波数の対数の位置ごとにh(x)を配置すれば、式(6)で示すように、それらの和がそのスペクトルになる。
【0041】
【数6】

また、構成音の強度(エネルギー)が異なるならば、強度p係数として、式(7)に示すように、h(x)に乗ずる。
【0042】
【数7】

次に、PC30において、フーリエ変換を実行し、入力された音楽データ50の基本周波数分布を算出する(ステップS4)。まず、得られた対数周波数スペクトルv(x)を、式(8)に示すように、逆フーリエ変換して、V(y)を算出する。
【0043】
【数8】

一方、得られた共通調波構造パターンh(x)を逆フーリエ変換して、H(y)を得る。
【0044】
【数9】

ここで、V(y)、H(y)をy領域で除算をし、逆畳み込み演算を行なえば、入力された音楽データ50の基本周波数分布が得られる。入力された音楽データ50の基本周波数分布をu(x)とすると、式(10)で表わすことができる。
【0045】
【数10】

次に、PC30において、入力された音楽データ50の基本周波数を解析する(ステップS5)。まず、算出された基本周波数分布u(x)の最大値Oを、式(11)に示すように、算出する。
【0046】
【数11】

ここで、最大値Oを取るxをxとし、xを時刻tにおける音楽データ50の基本周波数とする。
【0047】
次に、PC30において、任意の時間内における入力された音楽データ50の表現を抽出する(ステップS6)。本実施形態では、一例として、一定時間内における基本周波数列を示す。ただし、本発明の技術的思想は、これに限定されるわけではない。ここで、時刻tから時刻tまでの基本周波数列Xとする。
【0048】
【数12】

そして、例えば、無音を示す式(13)が得られれば、音楽データ50の表現として「無し」を抽出する。
【0049】
【数13】

また、開始を示す式(14)が得られれば、音楽データ50の表現として「挿入」を抽出する。
【0050】
【数14】

また、終了を示す式(15)が得られれば、音楽データ50の表現として「削除」を抽出する。
【0051】
【数15】

また、長音を示す式(16)が得られれば、音楽データ50の表現として「静止」を抽出する。
【0052】
【数16】

また、上昇を示す式(17)が得られれば、音楽データ50の表現として「拡大」を抽出する。
【0053】
【数17】

また、下降を示す式(18)が得られれば、音楽データ50の表現として「縮小」を抽出する。
【0054】
【数18】

また、繰返を示す式(19)が得られれば、音楽データ50の表現として「回転」を抽出する。
【0055】
【数19】

また、θHzより高音を示す式(20)が得られれば、音楽データ50の表現として「遠方」を抽出する。
【0056】
【数20】

また、θHzより低音を示す式(21)が得られれば、音楽データ50の表現として「近接」を抽出する。
【0057】
【数21】

また、短音を示す式(22)が得られれば、音楽データ50の表現として「軽快」を抽出する。
【0058】
【数22】

次に、PC30において、抽出された音楽表現に応じた視覚効果を写真データ40に付与する(ステップS7)。本実施形態では、一例として、対応ルールに基づく効果付与を示すが、本発明の技術的思想は、これに限定されるわけではない。例えば、
「無し」が抽出されれば「写真を非表示」、
「挿入」が抽出されれば「フェードしながら写真を表示」、
「削除」が抽出されれば「フェードしながら写真を非表示」、
「静止」が抽出されれば「写真を非遷移」、
「拡大」が抽出されれば「ズームインしながら写真を表示」、
「縮小」が抽出されれば「ズームアウトしながら写真を表示」、
「回転」が抽出されれば「回転しながら写真を表示」、
「遠方」が抽出されれば「サイズを小さくして写真を表示」、
「近接」が抽出されれば「サイズを大きくして写真を表示」、
「軽快」が抽出されれば「上下左右に揺らしながら写真を表示」、
等である。そして、抽出された音楽表現に対応する視覚効果を写真データ40に順次付与する。
【0059】
最後に、視覚効果を付与した写真データ40をディスプレイ10に映写すると共に、音楽データ50をスピーカ20から放射する(ステップS8)。
【0060】
このように、本実施形態によれば、PC30に入力される音楽データ50の基本周波数を解析し、一定時間内における基本周波数列を入力された音楽データ50の表現として抽出する。そして、抽出した表現に応じた視覚効果を入力される写真データ40に付与し、視覚効果を付与した写真データ40をディスプレイ10に映写すると共に、音楽データ50をスピーカ20a、20bから放射する。これにより、本実施形態では、市販の音楽など既存の音楽コンテンツを利用できる。また、本実施形態では、音楽データ50の再生に合わせて視覚効果を自動的に写真データ40に付与するので、効果付与のために予め作業は必要としない。さらに、音楽データ50内の局所的な変化に応じて視覚効果を付与するので、楽曲を切り替えることなく、印象の異なる画像を連続的に表示することが可能となる。
【0061】
以上説明したように、本実施形態によれば、任意の音響信号から音響特徴量を解析し、解析した音響特徴量における任意時間内の変化に基づいて音響の表現を抽出し、抽出した表現に応じた視覚効果を画像に付与し、視覚効果を付与した画像を画面に映写するので、市販の音楽など既存の音響コンテンツを利用できる。また、音響信号の再生に合わせて視覚効果を自動的に付与するので、効果付与のために予め作業は必要としない。さらに、同一楽曲内の局所的な変化に応じて視覚効果を付与すれば、楽曲を切り替えることなく、印象の異なる画像を連続的に表示することが可能である。
【符号の説明】
【0062】
10 ディスプレイ
20a スピーカ
20b スピーカ
20 スピーカ
30 PC
30−1 音響解析部
30−2 表現抽出部
30−3 効果付与部
30a ケーブル
30b ケーブル
40 写真データ
50 音楽データ

【特許請求の範囲】
【請求項1】
音響データの再生に応じて、効果を発生する音響再生装置であって、
任意の音響データにおける印象またはタイミングを表す音響表現を取得する表現取得部と、
前記取得した音響表現に応じた効果を任意の出力に付与する効果付与部と、
前記音響データおよび前記効果を付与した出力を再生する効果再生部と、を備えることを特徴とする音響再生装置。
【請求項2】
前記効果付与部は、前記取得した音響表現に応じた視覚効果を画像に付与し、
前記効果再生部は、前記音響データおよび前記視覚効果を付与した画像を再生することを特徴とする請求項1記載の音響再生装置。
【請求項3】
前記表現取得部は、音階を示す情報または分散和音を示す情報を含む任意の音型情報、または、音圧レベルを示す情報またはビート位置を示す情報を含む任意の同期情報における所定時間の変化に基づいて、前記音型情報または前記同期情報における音響表現を抽出する表現抽出部を備えることを特徴とする請求項1または請求項2記載の音響再生装置。
【請求項4】
任意の音響データを読み取り、前記音響データにおける任意の音響特徴量を解析し、前記音響特徴量に基づいて、前記音型情報または前記同期情報を抽出する音響解析部を備えることを特徴とする請求項3記載の音響再生装置。
【請求項5】
前記音型情報または前記同期情報が記録された媒体を計算機またはスキャナで読み取り、前記音型情報または前記同期情報を抽出する音響解析部、を備えることを特徴とする請求項3記載の音響再生装置。
【請求項6】
前記効果再生部は、前記音響データを再生し、前記視覚効果を付与した画像を画面に表示することを特徴とする請求項2記載の音響再生装置。
【請求項7】
前記音響データは、コンピュータファイル、光学メディア、または磁気メディアのいずれかであることを特徴とする請求項1から請求項4のいずれかに記載の音響再生装置。
【請求項8】
前記媒体は、MIDI、楽譜、または歌詞のいずれかであることを特徴とする請求項5記載の音響再生装置。
【請求項9】
前記画面は、スクリーン、ディスプレイ、テレビ、ビルの壁面、窓、ガラス、鏡、またはパネルのいずれかであることを特徴とする請求項7記載の音響再生装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2013−114088(P2013−114088A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−260975(P2011−260975)
【出願日】平成23年11月29日(2011.11.29)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】