医薬品マスタを簡単に取得するpythonライブラリ「jp-medicine-master」の紹介
医療データの分析を行ううえで、医薬品マスタなどの各種マスタは欠かせません。
複数のベンダーによって医薬品マスタが販売されていますが、高額のため個人には手が出せなかったり、新薬発売や薬価改定によりすぐに古いデータになってしまったり、といった課題があります。
一方、大元のマスタは厚生労働省や診療報酬支払基金といった公的機関が公開しており無償で利用可能ですが、ファイルの形式がまちまちだったりレイアウト上の問題で使用前にひと手間かかるものが多いです。
jp-medicine-masterは、その課題を解決するためのPythonライブラリです。このライブラリを使うことで、日本で使用されている医薬品マスタがコード1行で取得できるようになります。
jp-medicine-masterの特徴
-
統一したAPIでデータを簡単に読み込み
データ元によってZipファイルやExcelで配布されているマスタファイルを、わずか1行のコードで汎用的なcsvファイルに変換してダウンロードすることができます。 -
過去のデータも簡単に利用可能
分析目的によっては過去の時点でのマスタが必要な場合もありますが、jp-medicine-masterでは年度を指定するだけで簡単に過去のバージョンに切り替えることができます。
インストール
jp-medicine-masterはPyPIでインストール可能です。
pip install jp-medicine-master
基本的な使い方
以下はjp-medicine-masterを使った簡単な例です。
ライブラリのインポート
import jp_medicine_master as jpmed
各マスタについて、2種類の関数が実装されています。read_xxx系の関数でも、引数save_dir
を渡せば DataFrameとして読み込みつつcsvとして保存することも可能です。
- csvとして保存する関数(download_xxx)
- pandasのDataFrameとして読み込む関数(read_xxx)
レセプト電算処理システム用医薬品マスタ
診療報酬支払基金による医薬品マスタです。
Zipファイルの展開、ヘッダー行を付与が自動化されています。
出典: https://www.ssk.or.jp/seikyushiharai/tensuhyo/kihonmasta/index.html
# csvとして保存する場合
save_dir = '/path/to/directory'
filepath = jpmed.download_ssk_y(save_dir) # /path/to/directory/y_ALL20241205.csv
# pandasのDataFrameとして読み込む場合
df = jpmed.read_ssk_y()
# 過去のバージョンを取得する場合
df = jpmed.read_ssk_y(year=2022) # 令和4年(2022年)基本マスター
薬価基準収載医薬品
厚生労働省による薬価情報です。
Excelファイルの読み込み、ヘッダー行の修正が自動化されています。
出典: https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000078916.html
# csvとして保存する場合
save_dir = '/path/to/directory'
filepath = jpmed.download_mhlw_price(save_dir) # /path/to/directory/tp20241206-01.csv
# pandasのDataFrameとして読み込む場合
df = jpmed.read_mhlw_price()
後発医薬品に関する情報
厚生労働省による薬価情報です。
Excelファイルの読み込み、ヘッダー行の修正が自動化されています。
出典: https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000078916.html
# csvとして保存する場合
save_dir = '/path/to/directory'
filepath = jpmed.download_mhlw_ge(save_dir) # /path/to/directory/tp20241206-01_05.csv
# pandasのDataFrameとして読み込む場合
df = jpmed.read_mhlw_ge()
まとめ
jp-medicine-masterは、日本国内の医薬品データを効率的に扱うための強力なツールです。医療業界で働く方々や医薬品に関心のある研究者にとって、大いに役立つライブラリとなることを願っています。
オープンソースで提供されており、MITライセンスで自由に使用できます。
ソースコードはGitHubで公開されていますので、詳細や最新の情報はこちらをご確認ください。
GitHubリポジトリ: https://github.com/shiro46mt/jp-medicine-master
PyPIページ: https://pypi.org/project/jp-medicine-master
バグやご意見・ご要望などがありましたら、本記事のコメントやGitHubでのissueなどでお知らせいただけると非常に光栄です。
PR
NDBオープンデータの分析を手軽に行うためのライブラリを公開しています。
興味のある方はこちらも合わせてチェックしてみてください。
Discussion