診療情報管理士通信教育の基礎過程を修了しました
この記事は pyspaアドベントカレンダー19日目の記事ですがPythonの話はしてません。
背景
医療データを入力とする予測システム開発
何らかの予測システムを開発するときに、開発者の入力データに対する理解度はシステムの出力精度に大きく影響します。入力データの理解がないと予測に必要な情報がそもそも揃っているのか否か、追加で取るとベターな情報があったとして追加コストは割に合うのかなどの判断ができないからです。私はヘルステックスタートアップのUbie社でソフトウェアエンジニアをやっています。しばらく問診AIの開発をしていましたが、今現在は電子カルテの診療録テキストやオーダーリング情報を入力として病院の入院医療費会計に必要な情報を予測して出力するシステムを開発しています (プレスリリース)。

医療データを入力とする情報システムの例
他の業界から来た人間がカルテ読めない問題
英語と異なって日本語のカルテテキストは公開データセットが存在しないため、基本的にはそれに関わる業務に携るまで実物を目にする機会がありません。そして医学知識が無いと何が書いてあるのか読めません。以下はそれらしくLLMに生成させた例です。今ならわかりますが、初見時は何のことやらという状態でした。
既往歴:HTN(+), T2DM(+), dLp(+), CKD(-)
E2V3M5 JCS II-20
今後のDNARの方針について、KPにIC。
医学知識の無いエンジニアだけで医学データを入力とするサービスを開発することはありませんが、都度医師や医事会計の有識者に「これってこういう意味ですか?」と確認をとっているのでは開発スピードも上がりません。よって、ある程度は自分でも読める必要があります。私が主に取りくんでいる非構造化テキストを入力として傷病名(ICD-10コード)や処置コードを出力するタスクは分類問題になるので性能評価は要約や文書生成と比較して容易な方ですが、予測の誤りが素人っぽい間違えなのか人間のエキスパートでもしがちな誤りなのか判断するのはドメイン知識がないと難しいです。最近は生成モデルに「なぜその出力をしたかの根拠」を同時に出力させてユーザーに提示することも多いため、この説明文の妥当さも少しはわかる必要があります。
診療情報管理士通信教育
概要
以上の課題感から受講をはじめたのが日本病院会が開講している診療情報管理士通信教育コースです。 基礎課程1年と専門過程1年の合計2年のコースです。
基礎課程 12科目
①医療概論
②人体構造・機能論
③臨床医学総論 (外傷学、先天異常等含む)
④臨床医学各論Ⅰ(感染症および寄生虫症)
⑤臨床医学各論Ⅱ(新生物)
⑥臨床医学各論Ⅲ(血液・代謝・内分泌等)
⑦臨床医学各論Ⅳ(精神・脳神経・感覚器系等)
⑧臨床医学各論Ⅴ (循環器・呼吸器系)
⑨臨床医学各論Ⅵ(消化器・泌尿器系)
⑩臨床医学各論Ⅶ(周産期系)
⑪臨床医学各論Ⅷ(皮膚・筋骨格系等)
⑫医学・医療用語
専門課程 12科目
①医療管理総論
②医療管理各論Ⅰ(病院管理)
③医療管理各論Ⅱ(医療保険・介護保険制度)
④医療管理各論Ⅲ(医療安全・医療の質管理)
⑤保健医療情報学
⑥医療統計Ⅰ (統計理論)
⑦医療統計Ⅱ (病院統計・疾病統計)
⑧診療情報管理Ⅰ(法令・諸規則)
⑨診療情報管理Ⅱ(診療情報管理士の実務)
⑩診療情報管理Ⅲ(DPC・医師事務作業補助者・がん登録の実務)
⑪国際統計分類Ⅰ
⑫国際統計分類Ⅱ
現状の感想
基礎課程は正常系(生理学・解剖学)の内容は薄めで異常系(疾患の機序)について多くの時間が割かれていました。基本的に暗記なのですが シュニッツラー転移[1] や アイゼンメンゲル化[2] といったどこで何が起きてるのか全くわからない命名のオンパレードで最初はいちいち憤りを感じていたのですがそれも慣れました。ソフトウェア開発の分野で例えるとオブジェクトをJSON文字列化する処理を ダグラスクロックフォード化 と呼び、処理系の組み込み例外がすべて 「人名+Exception」 になっている世界です。発見時の命名がそのまま残るため インフルエンザ菌[3] といったややこしい名前がずっとそのままです。直接的な命名を至上とするソフトウェアの世界とは異なり、命名権と一貫性が重視されるとの事なのですが、最近は疾患名に発見者名を使うのを避けてdescriptiveな名前を付ける方向らしいので安心しました。そういえばCovid-19は(Coronavirus disease 2019)ですね。マダニは関連する疾患が多くて覚えきれないので絶滅してほしいです[4]。
暗記はキツイですが今はnano-bananaにわからない所を図解させられるので便利。

副甲状腺ホルモン(PTH)とカルシトニンによる血中カルシウム濃度の制御
医学用語の章は医学用語がよくある接頭辞や接尾辞の組みあわせであると説明があり、正にUSの病院データを使ったプロジェクトの開始前に受講したかった内容です。例えばgastritis(胃炎)は胃を表すギリシャ語幹の gastr- と炎症の表す接尾語の -itis の組みあわせで覚えられるといった具合です。下腕の橈骨が radius(ラテン語) であるのも調べれば意味が繋がるので面白いです。
副読書
次の3冊が理解の助けになりました。特に「死因の人類史」は国際疾病分類ICDの成り立ち、人類と感染症との戦いをどう記録に残してきたか理解が深まった。
- 死因の人類史(アンドリュー・ドイグ,2024)
- 運動・からだ図解 からだと病気のしくみ(田中文彦監修,2018)
- 医療の歴史―穿孔開頭術から幹細胞治療までの1万2千年史(スティーブパーカー,2016)
まとめ
来年の専門過程でようやく開発中のシステムの中核であるDPC(診断群分類包括支払制度)があるので楽しみです。必要だから学ぶといってもそれなりの時間を投資するので「あの時間、英語の勉強しときゃ生涯年収もっと上がってたな」とならないように活用の幅を広げていきたいです。
この記事は pyspaアドベントカレンダーの19日目の記事でした。

Discussion