私は、音声の物理的な特徴を調べたり、人間が音声を聞き取る知覚の仕組みを解明したりする音声学を専門としています。たとえば、お友達があなたに「おはよう」と言ったとします。そうすると、あなたの耳にはまず「お」が聞こえてきます。その次に「は」、「は」の次には「よ」、その次には「う」と、4つの音が次々に聞こえてきます。しかし物理的には、音声は連続体で切れ目がありません。そのように4つの音が聞こえたと思うのは、あくまでも皆さんの頭の中での解釈なのです。

「飴をなめる」と言った時に、その音声が物理的にどのような特徴をもつのか実際に見てみましょう。まず、「飴をなめる」を子音と母音に分けてみると、
/a/、/m/、/e/、/o/、/n/、/a/、/m/、/e/、/r/、/u/
と、6つの母音と4つの子音からできていることが分かります。ではそれを可視化してみましょう。図1は、私が「飴をなめる」と言った音声の波形で、口から音声を発したことによって生じた、空気の圧力の変化を示しています。振幅に大小はあるものの、子音や母音の境界は見当たりません。図2は、「飴をなめる」のスペクトログラム(いわゆる声紋と呼ばれているもの)で、色が濃いほど、その周波数にエネルギーが集中していることを示しています。こちらを見ても、音の切れ目はありません。つまり物理的な音声は、ひとつの音から次の音へと徐々に変化してゆくもので、ある音から別の音に急に変わるのではありません。私たちの脳は、絶え間なく変わりゆく連続体の音声を、言語的に意味のある塊に分けて知覚するという、とてつもなく高度な芸当を無意識になしとげているのです。専門用語では、これを分節化segmentationと呼びます。なぜ分節化が「芸当」なのか。それはもし分節化ができなければ、「ここは/a/と/m/の中間の音だ」とか、「ここは/m/に近いけど、/a/が少し混ざっていて、まだ/m/じゃないな」などといちいち考えなければならず、コミュニケーションは成り立たないからです。

図1. 「飴をなめる」の波形(話者は杉山)

図 2. 「飴をなめる」の波形(話者は杉山)

ひと昔前までは、音声分析は大がかりで高価な機械がないとできませんでした。しかし、今日では無料でダウンロードできるPraat(プラート、オランダ語で「話す」という意味だそうです)という音声分析ソフトウェアがあります。ぜひ皆さんも、自分の声を目で見てみませんか?

PraatのサイトのURL: http://www.fon.hum.uva.nl/praat/

ナビゲーションの始まり