JSON

【初心者向け】PythonでJSONファイルに日本語を出力する方法

はじめに

Python組み込みの「json」モジュールで、JSONファイルに日本語をそのまま出力する方法を解説します。

jsonモジュールでは、日本語の文字列をJSONファイルに出力する際、「\u30e6」のようなUnicodeエスケープ(シーケンス)という形式で出力します。別プログラム・環境で読み込むには便利な形式ですが、人が読むには非常に見ずらい形式です。

そこで今回は、日本語の文字列をそのままJSONファイルに出力する方法について解説します。


環境

この記事は以下の環境で作成しています。

Python   3.9.6
OS            Windows10                  

実行結果

後述の「日本語のJSONファイルを出力するコード」の実行結果です。
「ensure_ascii=False」を設定することで、日本語の文字列が、そのまま人が読める形で出力されています。

ensure_ascii=False の指定なし

「Roles」の部分が、Unicodeエスケープの形式で表示されています。

{
  "Email": "taro@example.com",
  "Active": true,
  "CreatedDate": "2013-01-20T00:00:00Z",
  "Roles": [
    "\u30e6\u30fc\u30b6\u30fc",
    "\u7ba1\u7406\u8005"
  ]
}

ensure_ascii=False の指定あり

「Roles」の部分が、人が読める形で出力されています。

{
  "Email": "taro@example.com",
  "Active": true,
  "CreatedDate": "2013-01-20T00:00:00Z",
  "Roles": [
    "ユーザー",
    "管理者"
  ]
}

全体コード

「 日本語のJSONファイルを出力するコード 」の全体です。ポイント部分は後述の「コードのポイント」で詳しく解説します。

import json


# JSONファイルを作成するための辞書を作成します
# (Rolesの部分に日本語の文字列が含まれています)
dict = {}
dict["Email"] = "taro@example.com"
dict["Active"] = True
dict["CreatedDate"] = "2013-01-20T00:00:00Z"
dict["Roles"] = ["ユーザー", "管理者"]

# ensure_ascii "なし" で出力します
with open("output_uniEscape.json", "w", encoding="utf-8" ) as outputFile:
    json.dump(dict, outputFile, indent=2 )

# ensure_ascii "あり" で出力します
with open("output_jp.json", "w", encoding="utf-8") as outputFile:
    json.dump(dict, outputFile, indent=2, ensure_ascii=False )

コードのポイント

「ensure_ascii = false」 の指定で日本語が出力できる

JSONファイルを出力するdump関数に「ensure_ascii = False 」を指定することで、日本語文字列をそのままファイルに出力できます。

# ensure_ascii "なし" で出力します
with open("output_uniEscape.json", "w", encoding="utf-8" ) as outputFile:
    json.dump(dict, outputFile, indent=2 )

# ensure_ascii "あり" で出力します
with open("output_jp.json", "w", encoding="utf-8") as outputFile:
    json.dump(dict, outputFile, indent=2, ensure_ascii=False )

「ensure_ascii = False 」の指定あり/なしでの、JSONファイルの出力結果は以下の通りです。

ensure_ascii = False なしの場合

{
  "Email": "taro@example.com",
  "Active": true,
  "CreatedDate": "2013-01-20T00:00:00Z",
  "Roles": [
    "\u30e6\u30fc\u30b6\u30fc",
    "\u7ba1\u7406\u8005"
  ]
}

ensure_ascii = False ありの場合

{
  "Email": "taro@example.com",
  "Active": true,
  "CreatedDate": "2013-01-20T00:00:00Z",
  "Roles": [
    "ユーザー",
    "管理者"
  ]
}

【参考】JSONファイルの文字コードについて

open関数を書き込みモードで使用する際、デフォルトでは「shift-jis」でファイルが作成されます。

pythonではデフォルトで「utf-8」を使用するので、コードと同じエディタでJSONファイルを開くと、
「Unicodeは回避したのに、日本語部分が文字化けしている」といった問題が出ることがあります。そのため、open関数を使用する際は「encode="utf-8"」の指定を入れることお勧めします。

まとめ

Python組み込みの「json」モジュールを使って、 JSONファイルに日本語をそのまま出力する方法を解説します。 参考になればうれしいです。

このブログではjsonモジュールの以下の内容も公開しています。興味のある方は是非以下の記事もご覧ください。

jsonモジュールでJSONファイルを読み込む方法

jsonモジュールでJSONファイル・JSON文字列を出力する方法

応援・要望お待ちしてます

ブログを見ていて「この辺を詳しく知りたい」「このライブラリの使い方を知りたい」「こんなことで困ってる」...etc があれば、コメント・問い合わせ・Twitterで教えてください。質問・ご要望に合わせて解説記事を作ります。

ブログを気に入っていただけたり、「応援してもいいよ」という方がいたら、ブログやSNSでの紹介をお願いします。 あたたかい応援は、中の人の更新の大きな励みになります。

ABOUT ME
えす
現役のソフトウェアエンジニアです。 C++ C# Python を使ってます。10年ちょい設計/開発部門にいましたが、今はQAエンジニアっぽいことをしています。

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です