前回の (1) はこちらから。 文字化け問題 ─⁠─ Perlの文字列の実装に迫る 次のテーマは文字列です。文字化けは、 プログラマの意図したエンコーディングと実際のエンコーディングが異なるときに起きる現象で、 どんなプログラミング言語でも問題に ...
HTML Living Standardには、文字エンコーディング宣言について以下の定義がある。 Regardless of whether a character encoding declaration is present or not, the actual character encoding used to encode the document must be UTF-8.
Pythonでファイル操作やネットワーク通信のプログラムを書いていると、突然こんな「謎の文字列」に出くわしたことはありませんか? b'\xe6\xad\xa3\xe5\xb8\xb8...' 「日本語を表示させたかったのに、記号と数字の羅列が出てきた」 「テキストファイルを読み込ん ...
Windows 10の日本語ロケール(日本語文字コード)は慣例的にShift_JISとなっていたが、時代の流れと共にUTF-8化が進んできた。例えばメモ帳で作成したテキストファイルのファイル形式は、すでにANSI(Shift_JIS)からBOMなしUTF-8に変更されている。 このUTF-8を ...
Excelがインストールされていると、拡張子が.csvのCSV(Comma Separated Values)ファイルはExcelに関連付けされている。エクスプローラーで.csvファイルをダブルクリックすればExcelが走り出す。しかし、日本語版Excelでは、ファイルのエンコードがシフトJISであると ...
サイトー企画は11月25日、多機能テキストエディタ「秀丸エディタ」の最新版となるバージョン9.00の提供を始めた。2010年3月30日にバージョン8.00を公開して以来、およそ11年8カ月ぶりのメジャーバージョンアップとなる。 今回のバージョンアップでは、対応OS ...