文字コード


🏈 UTF-8とUTF-16の違い

英数字だけならUTF-8の方がデータ量は少なくなります。日本語を含むならUTF-16のほうがよいです。

UTF-8

  • 8ビットの可変長マルチバイトで文字列を表現
  • 英数字は1バイト、日本語は3バイトで表現
  • 世界的には標準として使われています

UTF-16

  • 16ビットの可変長マルチバイトで文字列を表現
  • 英数字、日本語ともに2バイトで表現
  • Javaでは標準で使われています

🎃 参考リンク

📚 おすすめの書籍