「テキストエンコーディング」は、「Google Chrome」v55以降で廃止されたエンコーディング選択メニューの機能を代替する拡張機能。編集部にてWindows 10上の「Google Chrome」v57.0.2987.133で動作を確認した。“Chrome ウェブストア”からダウンロードできる。 「Google ...
Googleから、Webで使われているテキストのエンコーディング割合がOfficial Google Blog: Unicode nearing 50% of the webにおいて発表された。1年半前の発表時点の傾向が続いており、ほかのエンコーディングを引き離してUnicode (UTF-8)が50%のシェアへ近づいている。変化割合 ...
あるアプリで作成したデータを別のアプリに取り込んで使う場面というのは意外と多いものです。その中でも多いのが、CSVファイルのインポートとエクスポートです。CSVであればExcelやGoogleスプレッドシートなどで開いて手軽に編集できます。 しかし、その ...
下田 正弘(東京大学大学院人文社会系研究科 インド哲学仏教学專門分野 教授/次世代人文学開発センター人文情報学部門長) 2021年2月25日に公表されたTEIガイドライン(Text Encoding Initiative Guidelines)P5 version 4.2.0において、日本語のルビがガイドラインの基本 ...
自然言語処理(NLP)では、「単語」や「文章」のような文字情報を機械学習モデルに入力するために、数値ベクトルへ変換する必要があります。 その最も基本的な変換方法が One-Hot Encoding(ワンホットエンコーディング) です。 テキストデータ(単語や ...