Wikipedia preview
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2019/09/23 14:25:30」(JST)
[Wiki ja表示]
バイオリンのスペクトログラム(縦軸は線形周波数、横軸は時間)。色の線(すなわち輝点の連続)が周波数成分の経時変化を表す。色の明度は対数的(黒は −120dBFS)
スペクトログラム(英: Spectrogram)とは、複合信号を窓関数に通して、周波数スペクトルを計算した結果を指す。3次元のグラフ(時間、周波数、信号成分の強さ)で表される。
スペクトログラムは声紋の鑑定、動物の鳴き声の分析、音楽、ソナー/レーダー、音声処理などに使われている。スペクトログラムを声紋と呼ぶこともある。スペクトログラムを生成する機器をソノグラフ(sonograph)という。
形式
最も一般的な形式では、横軸が時間を表し、縦軸が周波数を表す。そして、各点の明るさや色である時点のある周波数での強さ(振幅)を表す。
形式には様々なバリエーションがある。横軸と縦軸を入れ替えて、時間が上下に流れる形式にすることもある。また、強さをZ軸とした3次元のグラフで描画することもある。周波数と強さは線型目盛でも対数目盛でもよく、用途によって使い分ける。例えば音声信号の場合、強さを対数目盛(通常、dB)で表し、倍音の関係を示す場合は周波数を線型目盛で表し、音楽的または音色的関係を表す場合は周波数を対数目盛で表す。
生成
スペクトログラムを作成する方法は主に2種類存在する。1つはバンドパスフィルタ群を使う方法、もう1つは短時間フーリエ変換(STFT)で計算する方法である。
フィルタを使った手法は主にアナログの連続信号で使われる。信号の周波数範囲(音声信号の場合、20Hz から 20kHz)を等間隔に分ける。ただし、線型に等間隔な場合(例えば 0-100、100-200、200-300、…)と対数的に等間隔の場合(例えば 10-100、100-1000、1000-10000、…)がある。信号が各フィルタに入力されると、その周波数帯域以外の周波数成分は除去される(ただし、実際のフィルタは窓関数としては不完全なので、周囲の周波数帯域の成分が若干残る)。各フィルタの出力を時間と共に記録する。その記録を水平にしたものを周波数帯域の順番に積み重ねるように置くと、横軸を時間とし縦軸を周波数としたスペクトログラムが完成する。
デジタル信号では、STFTを使ってスペクトログラムを作成する。時間領域で標本化されたデータはチャンクに分けられ(チャンクは一般にオーバーラップさせる)、チャンク毎にフーリエ変換を施す。各チャンクの変換結果がスペクトログラムのある時間の全周波数成分のグラフ(スペクトル)となるので、これを垂直において時系列に並べるとスペクトログラムが完成する。スペクトログラムでは、STFTの結果の絶対値を2乗したものを使う。
スペクトログラムからの音響生成
上述の変換処理を逆に行うこともできる。以下のプログラムはデジタル画像をスペクトログラムと解釈して音に変換できる。
- MetaSynth (Macintosh)
- Coagula (Windows)
- Enscribe (Linux)
- The Analysis & Resynthesis Sound Spectrograph (クロスプラットフォーム)
- JavOICe (Javaアプレット)
- FL Studio の "BeepMap"
ナイン・インチ・ネイルズのアルバム「イヤー・ゼロ」リーク版の最後にあるホワイトノイズ部分のスペクトログラフ
この技法を電子音楽のアーティストが利用して、音楽にスペクトログラムの画像を潜ませることがある。以下に例を挙げる。
- エイフェックス・ツインは自身の画像をスペクトログラムとして潜ませた。Windowlicker のトラック2の最後の9秒間がそれである。MP3でも認識可能だが、CDから直接スペクトログラム化したときほど鮮明ではない。同じシングルのトラック1にも螺旋の画像が潜ませてある[1] 。
- ナイン・インチ・ネイルズは2007年のアルバム「イヤー・ゼロ」でこの技法を使っている。イヤー・ゼロのリリース前にリークされた "My Violent Heart" には最後に無音の部分がある。ここをスペクトログラム化すると、空から手が伸びてきている画像が出てくる。正式リリース版では、"The Warning" という曲の最後に同じ画像がある。イヤー・ゼロには他にもいくつかの画像が潜ませてある。
現代音楽では、製作途中にスペクトログラムを使う場合がある。スペクトログラム化した状態で直接周波数や時点を指定して音の強さを変更し、再度もとの音に戻す。
関連項目
- スペクトラムアナライザ
- 高速フーリエ変換
- 短時間フーリエ変換
- ウェーブレット変換
- 分光器
- スペクトル
- 音声学
- コウモリ探知機
外部リンク
- Sonogram Visible Speech Javaで書かれたスペクトログラム生成ソフト。Java WebStart により直接ウェブページから起動できる。
- エイフェックス・ツインのスペクトログラム画像
- DiscreteTFDs - スペクトログラムなどを計算するソフトウェア(MATLAB用)
- Praat - 音声学用ソフトウェア
- KTH WaveSurfer - 音声視覚化ソフトウェア
- baudline signal analyzer - FFTスペクトログラムソフトウェア
- xeno-canto 3100以上の鳥の鳴き声のスペクトログラム
UpToDate Contents
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
- 1. 成人における嗄声hoarseness in adults [show details]
…depending on the underlying etiology. Treatment generally consists of voice rest, voice therapy, pharmacotherapy, and/or surgery . Voice rest is used for acute laryngitis, vocal fold hemorrhage, and other …
- 2. 小児における発話および言語障害の病因etiology of speech and language disorders in children [show details]
…stuttering . Voice disorders are related to misuse or organic changes of the vocal mechanism. Vocal quality also can be affected by hearing loss because of difficulty in self-monitoring . Causes of voice disorders …
- 3. てんかんに対する迷走神経刺激療法vagus nerve stimulation therapy for the treatment of epilepsy [show details]
…stimulation than with low stimulation. In the E05 study, shortness of breath and pharyngitis, as well as voice alteration, occurred significantly more often in the high-stimulation group than in the low-stimulation …
- 4. 火傷および熱傷の防止prevention of fire and burn injuries [show details]
…Africa have developed a device that replaces conventional dial controls in household kitchens with voice and hand gesture recognition sensors and software, which may be a solution for prevention in household…
- 5. 小児の嗄声の一般的な原因common causes of hoarseness in children [show details]
…change in the quality of the voice. The voice quality can be raspy, breathy, strained, fatigued, rough, tremulous, or weak. There may be a change in pitch, restriction of range, voice breaks, decreased projection …
Japanese Journal
- 福田 篤徳,小田谷 嘉弥,白川 浩一,白川 浩子,小澤 重雄,今井 光雄,深川 正夫,梅垣 佑介,山口 恭弘
- Bird Research 15(0), A1-A14, 2019
- … そこで,2016年1月から2018年5月にかけて,茨城県内のスゲ類などの低茎草本が優占しヨシ類などの高茎草本が混在する植生環境を含む12地域(14地点)でプレイバック法を用いて調査を行なった.種の同定は,声紋の解析や鳴き声が発せられた場所から飛び出した鳥の特徴から行なった.調査の結果,県内の7地域(9地点)において生息を確認し,その中の4地域(5地点)で複数個体の存在を確認した.そのうち1か所では …
- NAID 130007668863
- 音声のリアルタイム周波数解析に挑戦 My声紋(スペクトログラム)測定器を作る (特集 AIスピーカの礎… 音声信号の科学)
- 鳥の鳴き声を眺める : 音声解析を用いた鳥類調査への招待
Related Links
- 声紋の個人的特徴を識別するには、聴取試験、声紋採取、声紋比較などを行い、両者の声紋の再現性、特異的な位置の一致などが数多く存在すれば、両者の音声は同一人の音声と判断される。声紋の個人識別はかなり高い確率で識別
- また、声紋認証を行ううえで、マイクの性能も鍵になる。マイクの性能が高まれば、認識すべき音を拾いやすくなり、声紋認証の精度も高まることが予想される。声紋認証を実用化するには、ハードウェアの進化も欠かせないのだ。 今後声紋
- 声紋鑑定 人声の声紋検出は、ソナグラフ(サウンドスペクトログラフ)という 装置を使用し声紋を描き出します ヒトの言語音声には、言語的情報やバラ言語的情報、非言語的情報が含まれています。 私たちは、人の音声を聞いたとき、その意味を理解し、