URLエンコーディングの理解
URLエンコーディングは、URLですべての文字を安全に送信できるようにする基本的なWeb技術です。どのように機能し、なぜ重要なのかを学びます。
なぜURLエンコーディングが必要なのか
URLはASCII文字のサブセットのみで構成できます。スペース、特殊文字(&、=、?)、非ASCII文字(アクセント記号、日本語、絵文字)は、URLで直接使用できません。 これらの文字をURLに含める必要がある場合(ユーザーが「hello world」を検索する場合など)、それらをエンコードする必要があります。エンコーディングなしでは、URLは壊れるか、誤って解釈されるか、文字化けする可能性があります。 URLエンコーディングは、すべての文字を安全に送信できる形式に変換することでこれを解決します。
エンコーディングの仕組み
URLエンコーディングは、安全でない文字をパーセント記号に続いて16進数に置き換えます。スペースは%20になります。アンパサンド(&)は%26になります。等号(=)は%3Dになります。 非ASCII文字はより複雑です。日本語文字「あ」はUTF-8の3バイトです:E3 81 82。これは%E3%81%82としてエンコードされます—各バイトはパーセントエンコードされた16進数になります。 デコーディングは逆のプロセスです:パーセントエンコードされたシーケンスを元の文字に変換します。
一般的なエンコードされた文字
最も一般的に見られるエンコーディング:スペース→%20、!→%21、#→%23、$→%24、&→%26、'→%27、(→%28、)→%29、*→%2A、+→%2B、,→%2C、/→%2F、:→%3A、;→%3B、=→%3D、?→%3F、@→%40、[→%5B、]→%5D。 これらは、クエリパラメータや検索文字列でよく見られます。たとえば、「価格 > 100円」を検索すると、「%E4%BE%A1%E6%A0%BC%20%3E%20100%E5%86%86」のようにエンコードされる可能性があります。
ツールを試す
URLエンコーダー/デコーダー