かつてWindowsでテキストファイルといえばシフトJIS形式のものが大半だった。しかし最近では、UTF-8形式のテキストファイルも普通に見かけるようになってきた。世の中はUTF-8が主流になりつつあると言っていいだろう。 しかし、WindowsでUTF-8を使うと ...
前回の (1) はこちらから。 文字化け問題 ─⁠─ Perlの文字列の実装に迫る 次のテーマは文字列です。文字化けは、 プログラマの意図したエンコーディングと実際のエンコーディングが異なるときに起きる現象で、 どんなプログラミング言語でも問題に ...
Excelがインストールされていると、拡張子が.csvのCSV(Comma Separated Values)ファイルはExcelに関連付けされている。エクスプローラーで.csvファイルをダブルクリックすればExcelが走り出す。しかし、日本語版Excelでは、ファイルのエンコードがシフトJISであると ...
Excelがインストールされていると、拡張子が.csvのCSV(Comma Separated Values)ファイルはExcelに関連付けされている。エクスプローラーで.csvファイルをダブルクリックすればExcelが走り出す。 しかし、日本語版Excelでは、ファイルのエンコードがシフトJISであると ...
Windows 10の日本語ロケール(日本語文字コード)は慣例的にShift_JISとなっていたが、時代の流れと共にUTF-8化が進んできた。例えばメモ帳で作成したテキストファイルのファイル形式は、すでにANSI(Shift_JIS)からBOMなしUTF-8に変更されている。 このUTF-8を ...
Microsoftは米国時間2021年3月16日、組織内の行動データを可視化する「Microsoft Workplace Analytics(以下、Workplace Analytics)」に加えた更新を公式ブログを通じて報告した。メトリック(測定値)名でUTF-8エンコードが使用可能になり、R言語のwpaパッケージを用いたWorkplace ...
URLエンコードされた文字列をデコードして解読できるようにするソフト。Webページのフォームなどに入力した日本語などの2バイト文字は、一般にUTF-8やEUC-JP、ISO-2022-JPなどの文字コードに変換されてサーバーに送られる。そのため、サーバーのアクセスログ ...