「もしもし」が数字に変わるまで。電話の仕組みとデジタル通信がノイズに強い理由

普段何気なく使っている電話やスマートフォン。

実は私たちの「声」は、そのままの形で相手に届いているわけではありません。

空気の振動である声は、一瞬のうちに複雑な電気信号、さらには「0と1」の数字の羅列へと姿を変え、海を越え空を飛んでいきます。

なぜわざわざ数字に変えるのか？途中でデータが壊れたらどうなるのか？本記事では、電話の基本から、現代通信を支える「エラー訂正」の驚きの仕組みまで、その舞台裏をのぞいてみましょう。

声が電気に変わる仕組み（送受話器）
相手につながる仕組み（ネットワーク）
1. 固定電話（アナログ・光電話）
2. 携帯電話（スマホ）
アナログ信号
デジタル信号
声の大きさ：「振幅（しんぷく）」
声の高さ：「周波数（しゅうはすう）」
もう一つの要素：「音色（ねいろ）」
デジタル化の3ステップ（一点の情報ができるまで）
ノイズが「0」を「1」に変える仕組み
デジタルがノイズに「強い」と言われる理由
1. 判定の余裕（しきい値）
2. 誤り訂正（エラー訂正）
パリティチェック
高速処理
デジタル変換
おわりに

声が電気に変わる仕組み（送受話器）

電話は、なんで離れた人と話ができるの？

電話の仕組みは、一言で言うと「声という空気の振動を、電気の信号に変えて送り、再び空気の振動に戻す」というプロセスで成り立っています。

大きく分けて、「音を電気に変える仕組み」と「相手に届けるネットワークの仕組み」の2つの視点で解説します。

電話機の口元（送話器）と耳元（受話器）には、それぞれ重要な部品が入っています。

送話器（マイク）：私たちが声を出すと空気が震えます。その振動が送話器の中にある小さな膜（ダイアフラム）を揺らし、その動きを電気信号の強弱に変換します。
受話器（スピーカー）：届いた電気信号を磁石の力で再び振動板の動きに変えます。その振動が空気を震わせることで、相手の声として聞こえるようになります。

相手につながる仕組み（ネットワーク）

電話の種類によって、信号を運ぶルートが異なります。

固定電話（アナログ・光電話）

交換機：電話をかけると、まず地域の「交換機」に信号が飛びます。交換機は、入力された番号を見て、世界中の網目のような回線から相手へつながるルートを瞬時に判断して接続します。
光ファイバー：現代では多くの場合、電気信号は途中で「光の点滅」に変換され、高速な光ファイバーを通って遠くまで運ばれます。

携帯電話（スマホ）

基地局：スマホから出た信号は、まず近くの「基地局（アンテナ）」へ電波として飛びます。
ネットワーク：基地局で受け取った信号は、地下の専用回線（有線）を通って交換局へ送られ、そこから相手の近くの基地局へと運ばれます。

〜〜【アナログからデジタルへ】〜〜

昔の電話は声の揺れをそのまま電気の揺れとして送る「アナログ方式」でしたが、現在は「デジタル方式」が主流です。

デジタル方式とは、声の情報を「0」と「1」の数字の組み合わせに変換します。

デジタル化することで、ノイズに強くなり、同時にたくさんのデータを送れるため、音質が向上し、インターネット通信も可能になりました。

声を、どうやって信号で表現するの？

声を電気信号に変えて表現する方法には、大きく分けて「アナログ方式」と「デジタル方式」の2つのステップがあります。

現代の電話やスマートフォンでは、最終的にデジタルデータとして処理されていますが、その仕組みを順を追って解説します。

アナログ信号

声は空気の「密」と「疎」の繰り返し（波）です。これをマイクの膜（ダイアフラム）に当てて、その振動を電圧の強弱（アナログ電気信号）に変換します。

〜〜【仕組み】〜〜
声が大きければ電圧を高く、声が小さければ低くします。
また、声が高い（振動が細かい）ときは電圧の変化を速くします。

海の波の形を、そのまま折れ線グラフでなぞるようなイメージですね。

デジタル信号

現在主流のデジタル方式では、アナログの波を「0」と「1」の数字に置き換えます。これをPCM（パルス符号変調）と呼び、主に3つの工程で行われます。
詳しくは「デジタル化の3ステップ（一点の情報ができるまで）」

なぜデジタルにするの？

声をそのままの電気信号（アナログ）で送ると、途中でノイズ（雑音）が混ざったときに、どれが「声」でどれが「ノイズ」か区別できなくなります。

しかし、デジタル信号（0と1）であれば、

ノイズに強い：多少信号が乱れても「これは0か1か」さえ判別できれば、元の音を正確に復元できます。
圧縮できる：データの隙間を削ることで、一度にたくさんの人の声を送ったり、動画などの重いデータも一緒に送れるようになります。

このように、私たちの声は一瞬のうちに「空気の震え → 電圧の揺れ → 0と1の数字」という変化を経て、相手の元へと届けられています。

声の大きさ：「振幅（しんぷく）」

声の大きさは波の高さで、声の高さは波の幅ですか？

その通りです！まさに正解です。

物理学や音響工学の言葉で整理すると、より理解が深まります。

波の「高さ」のことです。

大きな声
　波の山が高く、谷が深くなります。空気を揺らすエネルギーが強いため、波が大きくなります。

小さな声
　波の山が低く、平坦に近い形になります。

声の高さ：「周波数（しゅうはすう）」

波の「幅（細かさ）」のことです。

高い声
　波の幅が狭く、1秒間の振動数が多くなります（ギザギザが細かい）。

低い声
　波の幅が広く、1秒間の振動数が少なくなります（ゆったりとした波）。

もう一つの要素：「音色（ねいろ）」

実は、声には「高さ」と「大きさ」以外に、もう一つ「波の形」という要素があります。

例えば、同じドの音（同じ高さ）を同じ大きさで出しても、ピアノとバイオリン、あるいはAさんとBさんの声が違って聞こえるのは、波の形（波形）が違うからです。

単純な音
　きれいな正弦波（サインカーブ）。

複雑な音（人の声など）
　いろいろな形の波が混ざり合った、複雑なギザギザの形。

〜〜【電話信号への置き換え】〜〜
振幅、周波数、音色を先ほどのデジタル化（PCM）の話につなげると、こうなります。

サンプリング（標本化）　：　波の「幅（高さの変化）」をどれくらい細かく刻むか。
量子化　：　波の「高さ（大きさ）」をどれくらい細かい数字で測るか。

このように、「高さ・大きさ・形」という3つの情報を数字に変換することで、私たちは離れた場所にいる人の声を、その人らしい声として聞くことができているのです。

デジタル化の3ステップ（一点の情報ができるまで）

標本化データ001010と量子化データ010101を足して、
ある一点の情報001010010101にする感じですか？

惜しいです！非常に鋭い洞察ですが、デジタル化の順番と役割が少しだけ入れ替わっています。

正しくは、「標本化で高さを測り、量子化でその高さをキリの良い数字にし、符号化で0と1にする」という流れになります。

わかりやすく、ある「一点」の情報がどう作られるか整理してみましょう。

例えば、ある瞬間の声の波の高さを測るシーンを想像してください。

１．標本化（サンプリング）
　タイミングを決める「今、この瞬間の高さを測るぞ！」と時間を区切ることです。
　ここではまだ「0101」という数字ではなく、単に「その瞬間の波の高さ（電圧）」を抜き出します。

２．量子化
　目盛りを読み取る抜き出した高さを、あらかじめ用意した目盛り（階段）に当てはめます。
　例えば、実際の高さが「5.234…」という中途半端な値でも、目盛りに合わせて「5」という整数値に丸めます。

３．符号化（コーディング）
　0と1に直すここでようやく、量子化された数字（例：「5」）を、コンピューターが読める「0と1の組み合わせ（例：0101）」に変換します。

質問してくださった「ある一点の情報」は、正確には以下のような構成になります。

ある一点の情報＝ [その瞬間の高さを表す0と1の塊]

例えば、1秒間に8,000回（標本化）この作業を行い、1回の高さを8ビット（01010101の8桁）で表現する場合、1秒間の声の情報は 8,000×8=64,000 個の「0」と「1」の羅列になります。

整理すると、

標本化：横軸（時間）を刻むこと。

量子化：縦軸（高さ）を刻むこと。

符号化：刻んだ結果を「0101…」というデータにすること。

ですので、「標本化で値を作り、量子化で値を作る」というよりは、「標本化と量子化で『座標』を決め、最後に符号化で『デジタル信号』にする」というイメージが一番近いです！

「デジタル信号」に戻る

ノイズが「0」を「1」に変える仕組み

ノイズは符号化された0101を0111にしてしまうのですか？

はい、その通りです！まさにそれがデジタル通信における「エラー（誤り）」の正体です。

アナログ信号の場合、ノイズが混ざると波の形がぐにゃりと歪み、そのまま「ザザッ」という雑音として聞こえてしまいます。一方、デジタルの世界ではもう少し「デジタルならでは」の現象が起きます。

デジタル信号といっても、実際には高い電圧（1）と低い電圧（0）という電気のオン・オフで送られています。

ここに強い電気的なノイズが乗ると、本来「0（低い電圧）」のはずの場所が、一瞬だけ「1（高い電圧）」の基準を超えてしまうことがあります。

１．送信側：0（低い）

２．途中のノイズ：ドカンと電圧が上がる

３．受信側：「あ、電圧が高いから 1 だな！」と誤解する

これが、ご指摘の「0101 が 0111 に化ける」という現象です。これを「ビット反転」と呼びます。

デジタルがノイズに「強い」と言われる理由

「化けてしまうなら、アナログより弱いのでは？」と思うかもしれませんが、デジタルには「修復する力」があります。

判定の余裕（しきい値）

アナログは波の形が少しでも変わればアウトですが、デジタルは「だいたいこれくらいの電圧以上なら1」という境界線（しきい値）を持っています。

多少のトゲのようなノイズが乗っても、境界線を越えなければ「0」は「0」のまま正しく伝わります。

誤り訂正（エラー訂正）

これがデジタルのすごいところです。データを送る際、あらかじめ「計算用の予備データ」をくっつけて送ります。

受信側は、届いた「0111」と予備データを照らし合わせます。

「あれ？計算が合わないぞ。3番目の 1 は本当は 0 じゃないとおかしいな」と計算で導き出し、勝手に 0101 に書き直して復元してしまいます。

もし訂正しきれなかったら？

ノイズが酷すぎて計算でも直せなくなった場合、以下のようなことが起こります。

音声通話：「プツッ」という一瞬の音飛びや、ロボットのような不自然な声になる。

データ通信：パケットを捨てて、「もう一回送って！」と相手にリクエストする（再送）。

このように、デジタルは「ノイズで化けることはあるけれど、化けたことに気づいて自力で直せる」からこそ、クリアな音声を届けられるのです。

アナログも「計算用の予備データ」を送ればデジタルと同じことができないですか？

結論から言うと、アナログ信号に「計算用の予備データ」を載せることは理論上非常に難しく、デジタルのように「元通りに修復する」ことはほぼ不可能です。

なぜアナログではそれができないのか、その根本的な理由を整理してみましょう。

１．「正解」が定義できない
デジタルとアナログの最大の違いは、「何が正しい状態か」を機械が判断できるかどうかにあります。

デジタル：正解は「0」か「1」の2種類しかありません。もし「0.7」という中途半端な信号が届いたら、機械は「ノイズのせいで0か1がズレたんだな」と判断し、計算（予備データ）を使って「本来は0だったはず」と導き出せます。

アナログ：波の高さが「5.0」なのか「5.0001」なのか、そのすべてに意味があります。ノイズで「5.0001」になったとき、それが「元々の小さな声」なのか「混じった雑音」なのか、機械には区別がつかないのです。

２．予備データ自体がノイズに埋もれる
仮に、アナログの波の横に「これは高さ5.0の波ですよ」という情報を別の波で送ったとしても、その「予備の波」自体もノイズの影響を受けて歪んでしまいます。

デジタルは「数字（記号）」として情報を送るため、形が崩れても記号さえ読み取れればOKです。

アナログは「形（物理量）」そのもので情報を送るため、情報を補足するためのデータすらもノイズで汚染されてしまい、信頼できなくなるのです。

３．「足し算」はできても「引き算」ができない
アナログ信号にノイズが乗るというのは、元の音に余計な音が「足し算」された状態です。

届いた音=元の声+ノイズ

これを元に戻すには「ノイズ」を正確に引き算しなければなりませんが、ノイズはランダムに発生するため、その正体（形）がわかりません。

デジタルの場合は、「0と1のルール」という絶対的な枠組みがあるおかげで、ルール違反（エラー）を見つけ出し、強引に元の数字へ書き換える「修復」が可能になります。

〜〜【絵と写真】〜〜

アナログ（絵）：模写した絵にコーヒーをこぼすと、元の線がどうだったか正確に復元するのは不可能です。

デジタル（文字）：「リンゴ」という文字が少し汚れて「リソゴ」になっても、「前後の文脈（予備データ）からして、これは『ン』だな」と推測して、完璧に「リンゴ」と書き直せます。

この「書き直せる（再現性がある）」という性質こそが、デジタルが通信や記録の世界を席巻した最大の理由です。

「0か1か」という一見不自由なルールに縛ることで、皮肉にも「情報の正確さ」という自由を手に入れたわけですね。

予備データがノイズの影響を受けることはないですか？

非常に鋭い視点です！

「予備データ」自体も信号である以上、ノイズの影響を全く同じように受けます。

しかし、それでもデジタルが成立するのは、「データが多少壊れても、中身を推測できるルール」を数学的に組み込んでいるからです。

なぜ予備データも汚染されるのに修復できるのか、その「魔法」の裏側を解説します。

１．予備データは「答え」ではなく「ヒント」
もし予備データが「元のデータは0101でした」というだけの単純なコピーなら、予備データが壊れた瞬間に共倒れしてしまいます。

デジタルの予備データ（誤り訂正符号）は、もっと賢い「パズルのような仕組み」になっています。

〜〜【例】〜〜
・パリティチェック（最も単純な例）「1」の数が偶数になるように予備の数字を1つ付け足す、というルールを決めます。

・元データ：110（1が2個なので、予備に 0 をつけて 1100 にする）

・ノイズで 1110 に化けた！

・受信側：「1が3個（奇数）だ！ルール違反だから、どこかが間違っているぞ」と気づけます。

２．「多数決」と「計算」でねじ伏せる
さらに高度な仕組み（ハミング符号やリード・ソロモン符号など）では、データと予備データを複雑に絡み合わせます。

〜〜【例】〜〜
・1つのデータに対して、複数の角度から計算した予備データを送ります。

・予備Aが「間違っている」と言い、予備Bも「間違っている」と言い、予備Cの計算結果から逆算すると「2番目のビットが犯人だ」と特定できる……といった具合です。

・たとえ予備データの一部がノイズで壊れても、残りの正しいデータと正しい予備データの組み合わせから、壊れた部分を数学的に導き出せるようになっています。

３．「0か1か」という究極のシンプルさ
ここがアナログとの決定的な差です。

アナログの場合：予備の波が「0.1」ズレたとき、それがノイズなのか、それとも「0.1ズレろ」という指示なのか判別できません。

デジタルの場合：予備データがノイズで「0.8」になっても、しきい値のおかげで「これは1だ」と正しく解釈されます。

つまり、「予備データそのものがノイズに強い（0か1かで判定するから）」＋「予備データの一部が壊れても他から復元できる（数学的構造）」という二段構えになっているのです。

【結論】
予備データもノイズの影響は受けます。しかし、デジタル通信では以下の前提で設計されています。

１．多少のノイズ：「0か1か」の判定余裕で、そもそもデータ化けさせない。
２．中程度のノイズ：データが化けても、数学的な「計算の整合性」で無理やり元の値を割り出す。
３．猛烈なノイズ：修復不可能。この時は「エラー」として通信を切るか、再送する。

アナログにはこの「数学的な整合性（パズル）」を持ち込む隙間がないため、ノイズに無抵抗になってしまう、というわけですね。

パリティチェック

パリティチェックの「1」の数が偶数に…の説明で、元データが100であった場合、予備に1をつけて1001にするということですか？

その通りです！完璧な理解です。

もし「1の数を偶数にする」というルール（偶数パリティ）に決めていた場合、データの作り方はこうなります。

１．送信側の処理
　元データ　　：　 100 （「1」が1個＝奇数）
　判断　　　　：　偶数にするために「1」を付け足そう。
　送信データ　：　 100 ＋ 1 ＝ 1001 （「1」が2個になり、偶数になった！）

２．受信側のチェック
　受け取った側は、届いたデータの「1」の数を数えます。
　正常な場合　：　 1001 が届く。
　「1」が2個（偶数）なので、「よし、壊れていないな」と判断して、お尻の 1 を捨てて 100 を取り出します。

３．ノイズで化けた場合：例えば 1101 になった。
　「1」が3個（奇数）なので、「あ、どこか1箇所がノイズでひっくり返ったぞ！」とエラーに気づくことができます。

４．パリティチェックの限界（こぼれ話）
　ここで鋭い方は気づくかもしれませんが、パリティチェックには「弱点」があります。
　もしノイズが強くて、2箇所同時にビットがひっくり返ったらどうなるでしょうか？
　1001 → 0101 （1番目と2番目が同時に化けた）
　受信側　：　「1」が2個……偶数だ！正常と判定してしまう！

このように、パリティチェックは「1箇所のミス」には気づけますが、2箇所のミスは見逃してしまいます。また、「どこが間違っているか」までは特定できず、ただ「何かがおかしい」と分かるだけです。

そのため、実際の高度な通信（スマートフォンの5G通信や、ボイジャーのような宇宙探査機からの通信）では、もっと複雑な「1の数だけでなく、縦横斜めで計算を組み合わせる」ような、より強力なパズル（エラー訂正符号）が使われています。

100を1001にするという発想、デジタルの基本原理をずばり捉えていますね！

高速処理

パリティチェックのような複雑な処理が高速で行えるのですか？

おっしゃる通り、1秒間に数万回、あるいは数億回という単位で「0と1」を計算するのは、人間からすれば気が遠くなるような作業ですよね。

それが可能な理由は、主に3つの技術的なパワーにあります。

１．専用の「職人」チップの存在
　スマホやパソコンの中には、汎用的な処理をするCPUのほかに、この「デジタル信号処理」だけを専門に行うDSP（デジタル・シグナル・プロセッサ）というチップや、特定の計算回路が入っています。

役割分担： CPUが「アプリを動かす」といった複雑な命令をこなすリーダーなら、DSPは「ひたすら0と1をパズルみたいに計算してエラーを直す」という単純作業を、超高速で繰り返す専門の職人です。

ハードウェア化：ソフトウェア（プログラム）で考えるのではなく、電気回路そのものが「計算機」の形をしているため、電気が通るスピードとほぼ同時に計算が終わります。

２．クロック周波数（処理のテンポ）

デジタル回路には、全体のリズムを刻む「クロック」というメトロノームのような信号があります。

現代のチップは、1秒間に数億〜数十億回（GHz：ギガヘルツ）という猛烈な速さでリズムを刻んでいます。

パリティチェックやエラー訂正の計算がたとえ100ステップあったとしても、1秒間に何十億回も動けるチップにとっては、まばたきするよりもずっと短い「一瞬」の出来事なのです。

３．並列処理（一斉に計算する）

一つずつ順番に計算するのではなく、「一気にまとめて計算する」仕組みも使われています。

例えば、1,000個のデータが届いたとき、それを1つずつチェックするのではなく、1,000個同時に計算回路に放り込んで、一瞬で「全部OK！」か「ここがダメ！」という結果を出します。

〜〜【実感としてのスピード】〜〜

あなたが電話で「もしもし」と言ったとき、その声がデジタル化され、エラーチェック用の数学的なパズルを解かれ、電波に乗って相手に届き、相手のスマホでまたパズルを解いて声に戻るまで、かかる時間はわずか0.1秒〜0.2秒程度です。

人間が「遅いな」と感じるよりもずっと速く、数学と電気回路が協力して、猛烈な勢いで「0と1のパズル」を解き続けているわけです。

デジタル変換

デジタルへの変換は電話機本体が行っていますか？スマホも本体で行っていますか？

結論から言うと、「その通り、基本的には本体で行っています」。

ただし、固定電話の場合は歴史が長いため、電話機の種類によって「どこでデジタルに変えるか」が少し異なります。

１．スマートフォンの場合（100% 本体）

スマホは、マイクのすぐ近くに「オーディオIC」という小さなチップが内蔵されています。

【処理の流れ】
マイクが拾ったアナログの震えは、ミリ単位の距離にあるチップに送られ、そこで即座にデジタル（0と1）に変換されます。

【理由】
スマホはそもそも「持ち運ぶコンピューター」なので、本体の中でデジタル化してしまわないと、電波に乗せて送ることができないからです。

２．固定電話の場合（種類によります）

固定電話は、家の中に引き込まれている回線の種類によって場所が変わります。

① 昔ながらのアナログ電話（黒電話や古いFAXなど）

【変換場所】
電話局（交換局）

【仕組み】
電話機自体は声をアナログな電気の揺れのまま送ります。家から電話局までの長い電線を「アナログ」のまま進み、電話局にある大きな設備（交換機）に入った瞬間にデジタルに変換されます。

【デメリット】
電話局までの距離が長いと、その途中でノイズが乗りやすくなります。

② 光電話（現在の主流）

【変換場所】
家にある「アダプター（ホームゲートウェイ）」

【仕組み】
電話機自体がアナログでも、家の中にある光回線の装置（ONUやルーター）に差し込んだ瞬間に、その装置がデジタル信号に変換して光ファイバーへ流します。

３．なぜ「なるべく早く」デジタルにするのか？

今の技術では、「できるだけマイクに近い場所でデジタルにする」のが鉄則です。

なぜなら、アナログ信号のままで長い距離を移動させると、途中で電線から発生するノイズや、他の家電の電波などの影響を受けて、音がどんどん汚れてしまうからです。

【スマホ】
内部のチップで瞬時にデジタル化（最強にノイズに強い）。

【最新の固定電話】
家の出口でデジタル化（かなりノイズに強い）。

【昔の電話】
電話局までアナログ（ノイズが入りやすい）。

私たちがスマホでクリアな音声を聴けるのは、声が空気の振動であるうちに、あるいは電気の揺れになってすぐの段階で、本体が「0と1の鉄壁のガード」を固めてくれているからなんですね。

おわりに

空気の震えが電気になり、数学的なパズルを経て、また誰かの耳を震わせる声に戻る。

電話という技術の裏側には、ノイズという物理的な限界に立ち向かうための、人類の知恵が詰まっています。

次にスマートフォンで誰かと話すとき、その一瞬の空白の中で行われている「超高速な0と1のやり取り」に、少しだけ思いを馳せてみてはいかがでしょうか。

でわっ！！