🗻 UTF-8とUTF-16の違い
英数字だけならUTF-8の方がデータ量は少なくなります。日本語を含むならUTF-16のほうがよいです。
UTF-8
- 8ビットの可変長マルチバイトで文字列を表現
- 英数字は1バイト、日本語は3バイトで表現
- 世界的には標準として使われています
UTF-16
- 16ビットの可変長マルチバイトで文字列を表現
- 英数字、日本語ともに2バイトで表現
- Javaでは標準で使われています
英数字だけならUTF-8の方がデータ量は少なくなります。日本語を含むならUTF-16のほうがよいです。