プログラミングでインデックスはなぜ0から始まるのか？

アルゴリズムの勉強をしていて一番不思議だったのは,「なぜ配列の最初の要素はインデックス1ではなく0から始まるのか」ということでした。次のようなリストがあるとします。

days = ["Mon", "Tue", "Wed", "Thu", "Fri"]

このリストの最初の要素は"Mon"で,2番目の要素は"Tue"です。では,なぜこのリストからTueを見つけるためにdays[2]ではなくdays[1]を使う必要があるのでしょうか?

これは,インデックスは1ではなく0から始まるからです。通常,私たちは実生活で上記のようなリストを見て,Tueの位置を尋ねられたら,2番目か2番目と答えるでしょう。

その理由が気になった私は,コンピュータサイエンスの基本原理と数学的な利点を調べることにしました。その結果,次のような事実を知ることができました。

1.歴史的背景

C言語が0ベースのインデックスを採用して以来,Python,Java,JavaScriptなど,現代のほとんどのプログラミング言語がこれに従うようになりました。
これは,プログラマーが他の言語に移行する際の混乱を軽減する一貫性を提供します。

2.オフセット(Offset)のコンセプト

0ベースのインデックス作成の最も重要な概念上の利点は,「オフセット」を自然に表現することです。

days = ["월", "화", "수", "목", "금"]
         ↑     ↑    ↑     ↑    ↑
         0     1    2     3    4

各インデックスは開始点からの距離を表します。
- "月":開始点から0マス離れている
- "火":開始点から1マス離れている
- "水":スタート地点から2マス下がる

3.メモリアドレス計算の効率

配列の開始アドレスがAで,各要素のサイズがSの場合
- 0ベースのインデックス: 要素のアドレス = A + (i × S)
- 1ベースのインデックス: 要素のアドレス = A + ((i-1) × S)

0ベースのインデックスは,追加の演算(-1)が必要ないので,より効率的です。

4.数学的な利点

区間の長さの計算

開始インデックスが0の場合,区間[0, N)の長さは単純にNとなります。
スライス作業がより直感的になります(例えば,最初の3つの要素は[0:3]です)。

繰り返し文の使用の簡素化

# 0 기반 인덱싱
for i in range(5):  # 0,1,2,3,4
    print(days[i])

# 1 기반이었다면
for i in range(1,6):  # 1,2,3,4,5
    print(days[i-1])  # 매번 -1 필요

実生活の類似例

定規で長さを測るとき,0cmから始まる
デジタル時計は0:00から始まる
建物の地下階数 (地下1階,地下2階...)

他のプログラミング言語の選択

ほとんどのプログラミング言語は0ベースのインデックスを使いますが,いくつかの言語は1ベースのインデックスを選択しました。

% MATLAB 예시
array = [1, 2, 3, 4, 5];
first_element = array(1);  % 1번째 요소

# R 예시
array <- c(1, 2, 3, 4, 5)
first_element <- array[1]  # 1번째 요소

-- Lua 예시
array = {1, 2, 3, 4, 5}
first_element = array[1]  -- 1번째 요소

これらの言語が1ベースのインデックスを選択した理由は次の通りです。

ユーザーベース
MATLAB: 主に数学者,科学者が使用し,行列を1から始まる数学的表記に慣れている。
R: 統計学者のための言語で,やはり数学的な直観性を重視しています。
用途の特殊性
科学計算,統計分析など特定の分野に特化した言語は,その分野の慣習に従うことがより重要でした。
一般的なプログラミング言語との整合性よりユーザーの利便性を優先した。
設計哲学
"コンピュータより人が理解しやすいものでなければならない"という哲学
技術的な効率性より人間の直観を優先する選択

このように,すべての言語が0ベースのインデックスだけが正解だとは思わない。それぞれの使用目的や対象に合った選択をしたのである。

数学における0ベース vs 1ベース

数学でも状況によって出発点が異なる。

1から始める場合
自然数の集合(1, 2, 3, ...)
行列の行と列の番号
順序を表す序数 (1st, 2nd, 3rd...)
0から始まる場合
整数集合 (..., -2, -1, 0, 1, 2, ...)
座標系(0,0)から始まる場合
距離や変位を測定する場合
指数(x⁰, x¹, x², ...)
多項式の次数

特にコンピュータサイエンスに関連する数学分野では,0ベースがより自然な場合が多い。
- 離散数学におけるグラフ理論
- 組合せ論における場合の数の計算
- 確率論における事象空間

したがって,「数学的直観=1ベース」と単純化することはできない。MATLABやRが1ベースを選択したのは,純粋に彼らの主なユーザー層が好む特定の数学分野(行列計算,統計)の慣習に従ったものである。

人間の直感性 vs コンピュータの効率性

プログラミング言語の設計で最も大きな悩みの一つは,「人間の直感性」と「コンピュータの効率性」のバランスです。0ベースのインデックスは,このトレードオフをよく示す例です。

直観性を諦めた代償

初めてプログラミングを学ぶ人が0ベースのインデックスに適応するのが難しいのは当然です。私たちはずっと「最初」を1で数えてきたからです。しかし,このような小さな直観性の放棄は,次のようなメリットをもたらしました。

より効率的なメモリアクセス
より簡単な範囲計算
少ないCPU演算

プログラミングの本質

結局,プログラミングは人間の考えをコンピュータが理解できるように翻訳するプロセスです。この過程で

時には人間がコンピュータの方式を受け入れなければならないし,時にはコンピュータが人間の方式に従わなければならない。

0ベースのインデックスは前者の良い例です。最初は不便だが,理解すると,より論理的で一貫性のあるシステムであることに気付く。

現代のプログラミング言語の解決方法

最新のプログラミング言語は,このような悩みをそれなりに解決しようと努力しています。Pythonを例に挙げてみよう。

# Python의 경우
days = ["월", "화", "수", "목", "금"]
first = days[0]       # 0 기반 인덱싱 사용
last = days[-1]      # 직관적인 음수 인덱싱 제공
third = days[2]      # 컴퓨터 친화적

このように基本はコンピュータに優しい方式を維持しながら,負のインデックスやスライシングのような人間に優しい機能を追加的に提供しています。

結論

最初にこの文章を書くきっかけは"なぜコンピュータの効率のために人間が直観性を諦めなければならないのか?"という疑問でした。検索を通じて知った1ベースのインデックス言語の設計哲学を見て,私は現在Pythonの開発者ですが,それらの言語の設計哲学に大きく共感しました。

しかし,これを深く掘り下げてみて気づいたことがある。プログラミングの本質は,結局,人間の考えをコンピュータが理解できるように翻訳する過程である。私たちが開発者としてすることはコンピュータと対話することであり,時には私たちがコンピュータの言語を学ぶ必要がある。

0ベースのインデックスは,最初は不便で非直感的に感じるかもしれません。しかし,この小さな直感の放棄は,より効率的なメモリアクセス,より簡単な範囲計算,より少ないCPU演算という利点をもたらします。

今ではある程度理解できるようになりました。0ベースのインデックスは単なる慣習やC言語の遺産ではなく,コンピュータサイエンスの基本原理に合致する論理的な選択であり,このような選択が現代プログラミングの発展を導いてきたことを。

結局,良いプログラミング言語とは,人間の直感とコンピュータの効率性の間で適切なバランスを見つけることではないだろうか? 0ベースのインデックスは,そのバランス点を探す過程で出てきた一つの答えだったのだ。