普段何気なく使っている電話やスマートフォン。
実は私たちの「声」は、そのままの形で相手に届いているわけではありません。
空気の振動である声は、一瞬のうちに複雑な電気信号、さらには「0と1」の数字の羅列へと姿を変え、海を越え空を飛んでいきます。
なぜわざわざ数字に変えるのか? 途中でデータが壊れたらどうなるのか? 本記事では、電話の基本から、現代通信を支える「エラー訂正」の驚きの仕組みまで、その舞台裏をのぞいてみましょう。
声が電気に変わる仕組み(送受話器)

電話は、なんで離れた人と話ができるの?
電話の仕組みは、一言で言うと「声という空気の振動を、電気の信号に変えて送り、再び空気の振動に戻す」というプロセスで成り立っています。
大きく分けて、「音を電気に変える仕組み」と「相手に届けるネットワークの仕組み」の2つの視点で解説します。
電話機の口元(送話器)と耳元(受話器)には、それぞれ重要な部品が入っています。
- 送話器(マイク): 私たちが声を出すと空気が震えます。その振動が送話器の中にある小さな膜(ダイアフラム)を揺らし、その動きを電気信号の強弱に変換します。
- 受話器(スピーカー): 届いた電気信号を磁石の力で再び振動板の動きに変えます。その振動が空気を震わせることで、相手の声として聞こえるようになります。
相手につながる仕組み(ネットワーク)
電話の種類によって、信号を運ぶルートが異なります。
固定電話(アナログ・光電話)
- 交換機: 電話をかけると、まず地域の「交換機」に信号が飛びます。交換機は、入力された番号を見て、世界中の網目のような回線から相手へつながるルートを瞬時に判断して接続します。
- 光ファイバー: 現代では多くの場合、電気信号は途中で「光の点滅」に変換され、高速な光ファイバーを通って遠くまで運ばれます。
携帯電話(スマホ)
- 基地局: スマホから出た信号は、まず近くの「基地局(アンテナ)」へ電波として飛びます。
- ネットワーク: 基地局で受け取った信号は、地下の専用回線(有線)を通って交換局へ送られ、そこから相手の近くの基地局へと運ばれます。
〜〜【アナログからデジタルへ】〜〜
昔の電話は声の揺れをそのまま電気の揺れとして送る「アナログ方式」でしたが、現在は「デジタル方式」が主流です。
デジタル方式とは、声の情報を「0」と「1」の数字の組み合わせに変換します。
デジタル化することで、ノイズに強くなり、同時にたくさんのデータを送れるため、音質が向上し、インターネット通信も可能になりました。

声を、どうやって信号で表現するの?
声を電気信号に変えて表現する方法には、大きく分けて「アナログ方式」と「デジタル方式」の2つのステップがあります。
現代の電話やスマートフォンでは、最終的にデジタルデータとして処理されていますが、その仕組みを順を追って解説します。
アナログ信号
声は空気の「密」と「疎」の繰り返し(波)です。これをマイクの膜(ダイアフラム)に当てて、その振動を電圧の強弱(アナログ電気信号)に変換します。
〜〜【仕組み】〜〜
声が大きければ電圧を高く、声が小さければ低くします。
また、声が高い(振動が細かい)ときは電圧の変化を速くします。

海の波の形を、そのまま折れ線グラフでなぞるようなイメージですね。
デジタル信号
現在主流のデジタル方式では、アナログの波を「0」と「1」の数字に置き換えます。これをPCM(パルス符号変調)と呼び、主に3つの工程で行われます。
詳しくは「デジタル化の3ステップ(一点の情報ができるまで)」

なぜデジタルにするの?
声をそのままの電気信号(アナログ)で送ると、途中でノイズ(雑音)が混ざったときに、どれが「声」でどれが「ノイズ」か区別できなくなります。
しかし、デジタル信号(0と1)であれば、
- ノイズに強い: 多少信号が乱れても「これは0か1か」さえ判別できれば、元の音を正確に復元できます。
- 圧縮できる: データの隙間を削ることで、一度にたくさんの人の声を送ったり、動画などの重いデータも一緒に送れるようになります。
このように、私たちの声は一瞬のうちに「空気の震え → 電圧の揺れ → 0と1の数字」という変化を経て、相手の元へと届けられています。
声の大きさ : 「振幅(しんぷく)」

声の大きさは波の高さで、声の高さは波の幅ですか?

その通りです!まさに正解です。

物理学や音響工学の言葉で整理すると、より理解が深まります。
波の「高さ」のことです。
大きな声
波の山が高く、谷が深くなります。空気を揺らすエネルギーが強いため、波が大きくなります。
小さな声
波の山が低く、平坦に近い形になります。
声の高さ : 「周波数(しゅうはすう)」
波の「幅(細かさ)」のことです。
高い声
波の幅が狭く、1秒間の振動数が多くなります(ギザギザが細かい)。
低い声
波の幅が広く、1秒間の振動数が少なくなります(ゆったりとした波)。
もう一つの要素 : 「音色(ねいろ)」

実は、声には「高さ」と「大きさ」以外に、もう一つ「波の形」という要素があります。
例えば、同じドの音(同じ高さ)を同じ大きさで出しても、ピアノとバイオリン、あるいはAさんとBさんの声が違って聞こえるのは、波の形(波形)が違うからです。
単純な音
きれいな正弦波(サインカーブ)。
複雑な音(人の声など)
いろいろな形の波が混ざり合った、複雑なギザギザの形。
〜〜【電話信号への置き換え】〜〜
振幅、周波数、音色を先ほどのデジタル化(PCM)の話につなげると、こうなります。
サンプリング(標本化) : 波の「幅(高さの変化)」をどれくらい細かく刻むか。
量子化 : 波の「高さ(大きさ)」をどれくらい細かい数字で測るか。
このように、「高さ・大きさ・形」という3つの情報を数字に変換することで、私たちは離れた場所にいる人の声を、その人らしい声として聞くことができているのです。
デジタル化の3ステップ(一点の情報ができるまで)

標本化データ001010と量子化データ010101を足して、
ある一点の情報001010010101にする感じですか?

惜しいです!非常に鋭い洞察ですが、デジタル化の順番と役割が少しだけ入れ替わっています。

正しくは、「標本化で高さを測り、量子化でその高さをキリの良い数字にし、符号化で0と1にする」という流れになります。

わかりやすく、ある「一点」の情報がどう作られるか整理してみましょう。
例えば、ある瞬間の声の波の高さを測るシーンを想像してください。
1.標本化(サンプリング)
タイミングを決める 「今、この瞬間の高さを測るぞ!」と時間を区切ることです。
ここではまだ「0101」という数字ではなく、単に「その瞬間の波の高さ(電圧)」を抜き出します。
2.量子化
目盛りを読み取る 抜き出した高さを、あらかじめ用意した目盛り(階段)に当てはめます。
例えば、実際の高さが「5.234…」という中途半端な値でも、目盛りに合わせて「5」という整数値に丸めます。
3.符号化(コーディング)
0と1に直す ここでようやく、量子化された数字(例:「5」)を、コンピューターが読める「0と1の組み合わせ(例:0101)」に変換します。

質問してくださった「ある一点の情報」は、正確には以下のような構成になります。
ある一点の情報 = [その瞬間の高さを表す0と1の塊]
例えば、1秒間に8,000回(標本化)この作業を行い、1回の高さを8ビット(01010101の8桁)で表現する場合、1秒間の声の情報は 8,000×8=64,000 個の「0」と「1」の羅列になります。
整理すると、
標本化: 横軸(時間)を刻むこと。
量子化: 縦軸(高さ)を刻むこと。
符号化: 刻んだ結果を「0101…」というデータにすること。
ですので、「標本化で値を作り、量子化で値を作る」というよりは、「標本化と量子化で『座標』を決め、最後に符号化で『デジタル信号』にする」というイメージが一番近いです!
ノイズが「0」を「1」に変える仕組み

ノイズは符号化された0101を0111にしてしまうのですか?

はい、その通りです!まさにそれがデジタル通信における「エラー(誤り)」の正体です。
アナログ信号の場合、ノイズが混ざると波の形がぐにゃりと歪み、そのまま「ザザッ」という雑音として聞こえてしまいます。一方、デジタルの世界ではもう少し「デジタルならでは」の現象が起きます。
デジタル信号といっても、実際には高い電圧(1)と低い電圧(0)という電気のオン・オフで送られています。
ここに強い電気的なノイズが乗ると、本来「0(低い電圧)」のはずの場所が、一瞬だけ「1(高い電圧)」の基準を超えてしまうことがあります。
1.送信側:0(低い)
2.途中のノイズ:ドカンと電圧が上がる
3.受信側:「あ、電圧が高いから 1 だな!」 と誤解する
これが、ご指摘の「0101 が 0111 に化ける」という現象です。これを「ビット反転」と呼びます。
デジタルがノイズに「強い」と言われる理由

「化けてしまうなら、アナログより弱いのでは?」と思うかもしれませんが、デジタルには「修復する力」があります。
判定の余裕(しきい値)
アナログは波の形が少しでも変わればアウトですが、デジタルは「だいたいこれくらいの電圧以上なら1」という境界線(しきい値)を持っています。
多少のトゲのようなノイズが乗っても、境界線を越えなければ「0」は「0」のまま正しく伝わります。
誤り訂正(エラー訂正)
これがデジタルのすごいところです。データを送る際、あらかじめ「計算用の予備データ」をくっつけて送ります。
受信側は、届いた「0111」と予備データを照らし合わせます。
「あれ?計算が合わないぞ。3番目の 1 は本当は 0 じゃないとおかしいな」と計算で導き出し、勝手に 0101 に書き直して復元してしまいます。

もし訂正しきれなかったら?

ノイズが酷すぎて計算でも直せなくなった場合、以下のようなことが起こります。
音声通話: 「プツッ」という一瞬の音飛びや、ロボットのような不自然な声になる。
データ通信: パケットを捨てて、「もう一回送って!」と相手にリクエストする(再送)。
このように、デジタルは「ノイズで化けることはあるけれど、化けたことに気づいて自力で直せる」からこそ、クリアな音声を届けられるのです。

アナログも「計算用の予備データ」を送ればデジタルと同じことができないですか?
結論から言うと、アナログ信号に「計算用の予備データ」を載せることは理論上非常に難しく、デジタルのように「元通りに修復する」ことはほぼ不可能です。

なぜアナログではそれができないのか、その根本的な理由を整理してみましょう。
1.「正解」が定義できない
デジタルとアナログの最大の違いは、「何が正しい状態か」を機械が判断できるかどうかにあります。
デジタル: 正解は「0」か「1」の2種類しかありません。もし「0.7」という中途半端な信号が届いたら、機械は「ノイズのせいで0か1がズレたんだな」と判断し、計算(予備データ)を使って「本来は0だったはず」と導き出せます。
アナログ: 波の高さが「5.0」なのか「5.0001」なのか、そのすべてに意味があります。ノイズで「5.0001」になったとき、それが「元々の小さな声」なのか「混じった雑音」なのか、機械には区別がつかないのです。
2.予備データ自体がノイズに埋もれる
仮に、アナログの波の横に「これは高さ5.0の波ですよ」という情報を別の波で送ったとしても、その「予備の波」自体もノイズの影響を受けて歪んでしまいます。
デジタルは「数字(記号)」として情報を送るため、形が崩れても記号さえ読み取れればOKです。
アナログは「形(物理量)」そのもので情報を送るため、情報を補足するためのデータすらもノイズで汚染されてしまい、信頼できなくなるのです。
3.「足し算」はできても「引き算」ができない
アナログ信号にノイズが乗るというのは、元の音に余計な音が「足し算」された状態です。
届いた音=元の声+ノイズ
これを元に戻すには「ノイズ」を正確に引き算しなければなりませんが、ノイズはランダムに発生するため、その正体(形)がわかりません。
デジタルの場合は、「0と1のルール」という絶対的な枠組みがあるおかげで、ルール違反(エラー)を見つけ出し、強引に元の数字へ書き換える「修復」が可能になります。
〜〜【絵と写真】〜〜
アナログ(絵): 模写した絵にコーヒーをこぼすと、元の線がどうだったか正確に復元するのは不可能です。
デジタル(文字): 「リンゴ」という文字が少し汚れて「リソゴ」になっても、「前後の文脈(予備データ)からして、これは『ン』だな」と推測して、完璧に「リンゴ」と書き直せます。

この「書き直せる(再現性がある)」という性質こそが、デジタルが通信や記録の世界を席巻した最大の理由です。

「0か1か」という一見不自由なルールに縛ることで、皮肉にも「情報の正確さ」という自由を手に入れたわけですね。

予備データがノイズの影響を受けることはないですか?

非常に鋭い視点です!
「予備データ」自体も信号である以上、ノイズの影響を全く同じように受けます。
しかし、それでもデジタルが成立するのは、「データが多少壊れても、中身を推測できるルール」を数学的に組み込んでいるからです。
なぜ予備データも汚染されるのに修復できるのか、その「魔法」の裏側を解説します。
1.予備データは「答え」ではなく「ヒント」
もし予備データが「元のデータは0101でした」というだけの単純なコピーなら、予備データが壊れた瞬間に共倒れしてしまいます。
デジタルの予備データ(誤り訂正符号)は、もっと賢い「パズルのような仕組み」になっています。
〜〜【例】〜〜
・パリティチェック(最も単純な例) 「1」の数が偶数になるように予備の数字を1つ付け足す、というルールを決めます。
・元データ:110(1が2個なので、予備に 0 をつけて 1100 にする)
・ノイズで 1110 に化けた!
・受信側:「1が3個(奇数)だ!ルール違反だから、どこかが間違っているぞ」と気づけます。
2.「多数決」と「計算」でねじ伏せる
さらに高度な仕組み(ハミング符号やリード・ソロモン符号など)では、データと予備データを複雑に絡み合わせます。
〜〜【例】〜〜
・1つのデータに対して、複数の角度から計算した予備データを送ります。
・予備Aが「間違っている」と言い、予備Bも「間違っている」と言い、予備Cの計算結果から逆算すると「2番目のビットが犯人だ」と特定できる……といった具合です。
・たとえ予備データの一部がノイズで壊れても、残りの正しいデータと正しい予備データの組み合わせから、壊れた部分を数学的に導き出せるようになっています。
3.「0か1か」という究極のシンプルさ
ここがアナログとの決定的な差です。
アナログの場合: 予備の波が「0.1」ズレたとき、それがノイズなのか、それとも「0.1ズレろ」という指示なのか判別できません。
デジタルの場合: 予備データがノイズで「0.8」になっても、しきい値のおかげで「これは1だ」と正しく解釈されます。
つまり、「予備データそのものがノイズに強い(0か1かで判定するから)」+「予備データの一部が壊れても他から復元できる(数学的構造)」という二段構えになっているのです。
【結論】
予備データもノイズの影響は受けます。しかし、デジタル通信では以下の前提で設計されています。
1.多少のノイズ: 「0か1か」の判定余裕で、そもそもデータ化けさせない。
2.中程度のノイズ: データが化けても、数学的な「計算の整合性」で無理やり元の値を割り出す。
3.猛烈なノイズ: 修復不可能。この時は「エラー」として通信を切るか、再送する。

アナログにはこの「数学的な整合性(パズル)」を持ち込む隙間がないため、ノイズに無抵抗になってしまう、というわけですね。
パリティチェック

パリティチェックの「1」の数が偶数に…の説明で、元データが100であった場合、予備に1をつけて1001にするということですか?

その通りです!完璧な理解です。
もし「1の数を偶数にする」というルール(偶数パリティ)に決めていた場合、データの作り方はこうなります。
1.送信側の処理
元データ : 100 (「1」が1個=奇数)
判断 : 偶数にするために「1」を付け足そう。
送信データ : 100 + 1 = 1001 (「1」が2個になり、偶数になった!)
2.受信側のチェック
受け取った側は、届いたデータの「1」の数を数えます。
正常な場合 : 1001 が届く。
「1」が2個(偶数)なので、「よし、壊れていないな」と判断して、お尻の 1 を捨てて 100 を取り出します。
3.ノイズで化けた場合: 例えば 1101 になった。
「1」が3個(奇数)なので、「あ、どこか1箇所がノイズでひっくり返ったぞ!」とエラーに気づくことができます。
4.パリティチェックの限界(こぼれ話)
ここで鋭い方は気づくかもしれませんが、パリティチェックには「弱点」があります。
もしノイズが強くて、2箇所同時にビットがひっくり返ったらどうなるでしょうか?
1001 → 0101 (1番目と2番目が同時に化けた)
受信側 : 「1」が2個……偶数だ!正常と判定してしまう!
このように、パリティチェックは「1箇所のミス」には気づけますが、2箇所のミスは見逃してしまいます。また、「どこが間違っているか」までは特定できず、ただ「何かがおかしい」と分かるだけです。
そのため、実際の高度な通信(スマートフォンの5G通信や、ボイジャーのような宇宙探査機からの通信)では、もっと複雑な「1の数だけでなく、縦横斜めで計算を組み合わせる」ような、より強力なパズル(エラー訂正符号)が使われています。

100を1001にするという発想、デジタルの基本原理をずばり捉えていますね!
高速処理

パリティチェックのような複雑な処理が高速で行えるのですか?

おっしゃる通り、1秒間に数万回、あるいは数億回という単位で「0と1」を計算するのは、人間からすれば気が遠くなるような作業ですよね。

それが可能な理由は、主に3つの技術的なパワーにあります。
1.専用の「職人」チップの存在
スマホやパソコンの中には、汎用的な処理をするCPUのほかに、この「デジタル信号処理」だけを専門に行うDSP(デジタル・シグナル・プロセッサ)というチップや、特定の計算回路が入っています。
役割分担: CPUが「アプリを動かす」といった複雑な命令をこなすリーダーなら、DSPは「ひたすら0と1をパズルみたいに計算してエラーを直す」という単純作業を、超高速で繰り返す専門の職人です。
ハードウェア化: ソフトウェア(プログラム)で考えるのではなく、電気回路そのものが「計算機」の形をしているため、電気が通るスピードとほぼ同時に計算が終わります。
2.クロック周波数(処理のテンポ)
デジタル回路には、全体のリズムを刻む「クロック」というメトロノームのような信号があります。
現代のチップは、1秒間に数億〜数十億回(GHz:ギガヘルツ)という猛烈な速さでリズムを刻んでいます。
パリティチェックやエラー訂正の計算がたとえ100ステップあったとしても、1秒間に何十億回も動けるチップにとっては、まばたきするよりもずっと短い「一瞬」の出来事なのです。
3.並列処理(一斉に計算する)
一つずつ順番に計算するのではなく、「一気にまとめて計算する」仕組みも使われています。
例えば、1,000個のデータが届いたとき、それを1つずつチェックするのではなく、1,000個同時に計算回路に放り込んで、一瞬で「全部OK!」か「ここがダメ!」という結果を出します。
〜〜【実感としてのスピード】〜〜
あなたが電話で「もしもし」と言ったとき、その声がデジタル化され、エラーチェック用の数学的なパズルを解かれ、電波に乗って相手に届き、相手のスマホでまたパズルを解いて声に戻るまで、かかる時間はわずか0.1秒〜0.2秒程度です。
人間が「遅いな」と感じるよりもずっと速く、数学と電気回路が協力して、猛烈な勢いで「0と1のパズル」を解き続けているわけです。
デジタル変換

デジタルへの変換は電話機本体が行っていますか?スマホも本体で行っていますか?

結論から言うと、「その通り、基本的には本体で行っています」。

ただし、固定電話の場合は歴史が長いため、電話機の種類によって「どこでデジタルに変えるか」が少し異なります。
1.スマートフォンの場合(100% 本体)
スマホは、マイクのすぐ近くに「オーディオIC」という小さなチップが内蔵されています。
【処理の流れ】
マイクが拾ったアナログの震えは、ミリ単位の距離にあるチップに送られ、そこで即座にデジタル(0と1)に変換されます。
【理由】
スマホはそもそも「持ち運ぶコンピューター」なので、本体の中でデジタル化してしまわないと、電波に乗せて送ることができないからです。
2.固定電話の場合(種類によります)
固定電話は、家の中に引き込まれている回線の種類によって場所が変わります。
① 昔ながらのアナログ電話(黒電話や古いFAXなど)
【変換場所】
電話局(交換局)
【仕組み】
電話機自体は声をアナログな電気の揺れのまま送ります。家から電話局までの長い電線を「アナログ」のまま進み、電話局にある大きな設備(交換機)に入った瞬間にデジタルに変換されます。
【デメリット】
電話局までの距離が長いと、その途中でノイズが乗りやすくなります。
② 光電話(現在の主流)
【変換場所】
家にある「アダプター(ホームゲートウェイ)」
【仕組み】
電話機自体がアナログでも、家の中にある光回線の装置(ONUやルーター)に差し込んだ瞬間に、その装置がデジタル信号に変換して光ファイバーへ流します。
3.なぜ「なるべく早く」デジタルにするのか?
今の技術では、「できるだけマイクに近い場所でデジタルにする」のが鉄則です。
なぜなら、アナログ信号のままで長い距離を移動させると、途中で電線から発生するノイズや、他の家電の電波などの影響を受けて、音がどんどん汚れてしまうからです。
【スマホ】
内部のチップで瞬時にデジタル化(最強にノイズに強い)。
【最新の固定電話】
家の出口でデジタル化(かなりノイズに強い)。
【昔の電話】
電話局までアナログ(ノイズが入りやすい)。

私たちがスマホでクリアな音声を聴けるのは、声が空気の振動であるうちに、あるいは電気の揺れになってすぐの段階で、本体が「0と1の鉄壁のガード」を固めてくれているからなんですね。
おわりに
空気の震えが電気になり、数学的なパズルを経て、また誰かの耳を震わせる声に戻る。
電話という技術の裏側には、ノイズという物理的な限界に立ち向かうための、人類の知恵が詰まっています。
次にスマートフォンで誰かと話すとき、その一瞬の空白の中で行われている「超高速な0と1のやり取り」に、少しだけ思いを馳せてみてはいかがでしょうか。
でわっ!!

コメント